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数据 结构 是 计算 机 程序 设计 重要 的 理论 技术 基础 ， 它 不 仅 是 计算 机 学 科 的 核心 课程 ， 
而 且 己 经 成 为 计算 机 相关 专业 必要 的 选修 课 。 其 要 求 是 学 会 分 析 、 研 究 计 算 机 加 工 的 数据 
结构 的 特性 ， 初 步 掌 握 算 法 的 时 间 和 空间 分 析 技 术 ， 并 能 够 编写 出 结构 清晰 、 正 确 易 读 的 
算法 ， 达 到 塔 养 数据 抽 象 能 力 的 目的 。 学 习 数 据 续 构 可 以 使 读者 碰 到 有 基体 问题 时 ， 能 够 找 
到 一 个 优化 的 存储 结构 和 解决 方法 。 本 书 利用 目前 流行 的 开发 工具 Java 语言 进行 数据 结构 
设计 ， 包 含 了 数据 结构 的 全 部 内 容 ， 人 符合 大 学 的 教学 大 纲 ， 既 可 以 作为 大 学 数据 结构 课程 
的 教材 ， 又 可 以 为 程序 设计 者 学 习 数据 结构 提供 帮助 。 

本 书 以 数据 结构 为 主线 , 是 在 Java 语言 的 基础 之 上 编写 的 , 希望 读者 在 阅读 本 书 之 前 ， 
最 好 具备 Java 语言 基础 。 这 样 ， 在 学 习 数 据 结 构 时 ， 能 够 比较 容易 地 建立 正确 的 数据 结构 
中 的 存储 和 逻辑 概念 。 

本 书 共 分 10 章 ， 第 1 章 综述 了 数据 结构 中 的 基本 概念 ， 第 2 章 主 要 描述 了 线性 结构 
的 存储 与 实现 ; 第 3 章 描 述 了 特殊 的 线性 结构 的 存储 及 其 实现 ;第 4 章 着 重 描述 了 数组 的 
仔 储 及 数组 的 运算 ; 第 $ 章 描 述 了 层次 结构 的 各 种 运算 ; 第 6 章 描 述 了 网 状 结构 的 存储 及 
实现 算法 ; 第 7 章 介 绍 了 各 种 排序 的 方法 及 算法 比较 : 第 8 章 主 要 介绍 了 得 找 方法 ; 第 9 
章 介 绍 了 操作 系统 中 涉及 的 动态 存储 管理 的 基本 技术 ; 第 10 章 介 绍 了 常用 文件 结构 。 本 书 
的 内 容 突出 了 抽象 数据 类 型 的 概念 ， 对 每 一 种 数据 结构 都 给 出 了 相应 的 抽象 数据 类 型 的 规 
范 说 明和 实现 。 : 

我 们 加 使 用 本 教材 的 教师 免费 提供 本 书 的 电子 教案 ， 其 下 载 网 址 为 
http://www.tupwk.com.cn/downpage/index.asp。 需 要 本 书 习 题 参 考 答案 的 教师 请 发 邮件 至 
cwkbook@tup.tsinghua.edu.cn, 邮件 的 主题 请 设 为 “获取 《数据 结构 与 算法 分 析 》 参 考 答案 ”。 

本 书 的 第 1~4 章 、 第 9 和 第 10 章 由 王 世 民 编写 ， 第 $5 和 第 6 章 由 朱 建 方 编写 ， 第 7 
和 第 8 章 由 孔 凡 航 编写 ， 朴 漏 之 处 若 请 读者 提出 宝贵 意见 或 建议 。 
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第 1 章 





数据 结构 概论 


信息 是 计算 机 科学 的 基础 ， 信 息 必 须 以 数据 的 方式 ， 按 照 一 定 的 规则 存储 在 计算 机 的 
存储 器 中 。 对 数据 的 操作 方法 如 增加 、 插 入 、 删 除 、 查 询 等 既 要 考虑 数据 的 存储 ， 又 要 考 
虑 数据 操作 中 数据 的 处 理 速度 等 各 方面 的 因素 。 闻 习 数据 结构 及 其 相关 民法 可 以 有 效 地 完 
成 数据 处 理 并 提高 数据 的 处 理 效率 。 


本 章 的 学 习 目 标 : 

e 数据 结构 的 研究 内 容 ; 

数据 结构 中 的 基本 概念 、 常 用 术语 ，; 
学 习 数 据 结构 的 意义 ; 

Java 语言 描述 ; 

对 算法 进行 摘 述 和 分 析 的 方法 。 


1.1 什么 是 数据 结构 


众所周知 ， 计 算 机 是 一 种 信息 处 理 装置 ， 信 息 中 的 各 个 数据 元 素 并 不 是 孤立 存在 的 ; 
它们 之 间 存 在 着 一 定 的 结构 关系 。 如 何 表示 这 些 结构 关系 ， 如 何在 计算 机 中 存储 数据 和 
信息 ， 采 用 什么 样 的 方法 和 技巧 加 工 与 处 理 这 些 数 据 ， 都 是 数据 结构 课程 需要 努力 解决 
的 问题 。 

一 般 来 说 ， 使 用 计算 机 解决 具体 问题 时 ， 通 常 需要 几 个 步骤 分析 具 体 问题 得 到 数学 
模型 ， 设 计 解决 数学 模型 的 算法 ， 编 制程 序 并 调试 ， 最 后 得 到 最 终 答案 。 

。 要 想得到 数据 模型 ， 必 须 了 解数 据 之 间 的 关系 ， 在 数据 结构 中 数据 之 间 的 关系 主要 有 
两 种 , 它们 分 别 是 线性 关系 和 非 线性 关系 , 其 中 非 线性 关系 又 可 以 分 为 树 型 关系 和 图 关系 。 
确定 了 数据 之 间 的 关系 后 ， 可 以 将 数据 存储 在 计算 机 内 ， 所 以 说 数据 的 逻辑 结构 和 存储 结 
构 是 密 不 可 分 的 两 个 方面 ， 在 实现 算法 时 ， 首 先 应 解决 数据 的 存储 问题 。 

为 了 说 明 这 些 ， 可 以 通过 以 下 的 例子 说 明 。 

例 1: 图 1-1 是 一 个 班级 若干 名 学 生 的 登记 表 ， 使 用 计算 机 管理 该 表格 ， 可 以 把 所 有 
学 生 的 登记 表 看 作 一 个 文件 ， 它 由 若干 条 记录 组 成 ， 每 个 学 生 对 应 一 条 记录 ， 每 条 记录 占 
一 行 ， 每 行 中 有 若干 列 ， 包 括 学 号 、 姓 名 、 性 别 、 年 龄 等 属性 ， 反 应 了 每 个 学 生 的 基本 情 
况 ， 每 条 记录 按 学 号 从 小 到 大 排列 。 


。2。 数据 结构 与 算法 分 析 (Java 版 ) 





图 1-1 线性 结构 图 


因为 每 个 学 生 的 属性 相同 ， 将 每 个 学 生 的 各 种 属性 集合 抽象 为 一 个 独立 的 数据 单位 ， 
与 每 个 数据 单位 相 邻 的 前 一 个 数据 单位 最 多 只 能 有 一 个 (第 一 个 数据 单位 没有 ), 与 每 个 数据 
单位 相 邻 的 后 一 个 数据 单位 最 多 只 能 有 一 个 (最 后 一 个 数据 单位 没有 )。 这 时 可 以 将 文件 中 的 
数据 单位 的 集合 称 为 数据 集合 ， 我 们 将 这 种 数据 单位 之 间 的 关系 称 为 线性 关系 。 也 就 是 说 ， 
该 数据 文件 的 逻辑 结构 为 线性 结构 ， 也 称 该 文件 为 一 个 线性 表 。 在 这 种 结构 中 ， 计 算 机 内 
可 以 采用 多 种 方法 存储 ， 在 存储 数据 时 ， 只 要 能 够 体现 出 数据 元 素 之 间 的 线性 关系 即 可 。 

对 于 这 个 文件 ， 我 们 可 以 进行 的 操作 有 : 如 果 某 个 学 生 离 开学 校 ， 应 从 该 文件 中 将 此 
学 生 删 除 ， 对 应 的 操作 就 是 删除 一 个 数据 元 素 ， 如 果 新 来 一 位 同学 ， 则 相应 的 操作 是 在 该 
线性 表 中 插入 一 个 数据 元 素 ; 新 年 伊始 ， 每 位 同学 的 年 龄 应 增加 一 岁 ， 对 应 的 操作 就 是 修 
改 所 有 同学 的 年 龄 ， 如 果 不 要 求 按 学 号 从 小 到 大 排列 ， 需 要 按 姓名 的 字典 顺序 排列 ， 对 应 
的 操作 就 是 排序 等 。 | 

所 以 数据 之 间 既 要 考虑 存储 ， 又 要 考虑 数据 单位 之 间 的 关系 ， 在 确定 了 存储 结构 后 ， 
根据 存储 的 结构 再 来 确定 相应 操作 的 实现 方法 。 

例 2: 我 们 使 用 的 微机 中 ， 每 个 逻辑 盘 都 有 一 个 根 目录 ， 根 目录 下 可 以 建立 若干 个 子 
目录 ， 而 每 个 子 目 录 下 又 可 以 创建 若干 个 子 目录 (如 图 1-2 所 示 )， 形 成 一 个 对 应 多 个 的 关 
系 称 为 层次 关系 ( 树 型 关系 )。 

如 果 将 每 个 目录 作为 一 个 独立 的 数据 单位 ， 那 么 每 个 子 目录 只 有 一 个 父 目录 ， 但 是 它 
又 允许 有 若干 个 子 目录 。 我 们 可 以 将 目录 的 集合 看 作 是 数据 的 集合 ， 目 录 之 间 的 关系 看 作 
是 非 线性 关系 中 的 层次 模型 。 

在 此 例 中 ， 比 较 典 型 的 是 根 目 录 不 能 删除 ， 每 个 子 目 录 可 以 删除 ， 并 且 每 个 目录 下 可 
以 存储 若干 文件 。 此 时 的 存储 像 一 棵 倒 树 ， 根 目录 像 大 树 的 树 根 (只 有 一 个 )， 子 目录 像 大 
树 的 树枝 (允许 多 个 )， 而 每 个 目录 下 的 文件 又 像 树枝 上 的 树叶 ， 此 种 结构 层次 分 明 ， 所 以 
又 称 层次 结构 。 

对 应 此 种 结构 的 操作 有 : 如 果 某 个 目录 需要 删除 ( 根 目录 例外 )， 对 应 的 操作 就 是 删除 
该 目录 以 及 该 目录 下 的 文件 ， 又 称 删除 结 点 ( 子 树 )， 如 果 在 此 结构 下 增加 一 个 管理 目录 ， 
对 应 的 操作 是 在 树 结构 中 添加 一 个 结 点 ， 查 找 某 个 子 目 录 ， 我 们 一 般 的 操作 是 从 根 目录 开 
始 ， 依 次 往 下 查找 ， 对 应 的 数据 结构 的 操作 就 是 查找 等 。 

在 此 种 结构 中 比较 关键 的 是 各 种 对 应 的 操作 一 般 从 根 目 录 开 始 ， 对 应 数据 结构 中 的 操 
作 就 是 从 根 结 点 开始 。 

例 3， 如 果 以 每 台 计 算 机 为 结 点 ， 组 成 计算 机 网 络 ， 在 计算 机 网 络 中 ， 每 台 计 算 机 之 
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间 可 以 实现 通信 ， 此 时 每 台 计 算 机 之 间 可 以 与 多 台 计 算 机 进行 通信 (如 图 1-3 所 示 )。 


和 统 (C:) 
B C3 Documents and Setings 





图 1-2 层次 结构 图 图 1-3 图 结构 


如 果 以 每 台 计 算 机 为 结 点 ， 每 台 计算 机 可 以 通过 传输 介质 与 其 他 计算 机 进行 通信 ， 此 
时 每 台 计 算 机 之 前 可 以 有 多 台 计 算 机 ， 每 台 计 算 机 之 后 也 可 以 有 多 台 计 算 机 。 简 单 将 计算 
机 之 间 的 关系 可 以 理解 为 多 对 多 的 关系 ， 属 于 非 线性 关系 中 的 图 关系 。 

在 此 种 结构 中 以 每 台 计 算 机 作为 结 点 ， 如 果 它 为 其 他 计算 机 提供 服务 ， 则 该 计算 机 就 
是 被 提供 服务 的 计算 机 的 前 趋 ， 接 受 服务 的 计算 机 则 称 为 该 计算 机 后 继 ， 同 时 为 其 他 计算 
机 提供 服务 的 计算 机 可 能 又 接受 多 台 计 算 机 为 它 提供 的 服务 ， 所 以 说 每 台 计 算 机 既是 多 台 
计算 机 的 前 趋 ， 又 是 多 台 计 算 机 的 后 继 。 

如 果 将 此 结构 存储 后 ， 所 对 应 的 操作 有 : 如 果 在 网 络 中 增加 一 台 计算 机 ， 对 应 的 操作 
是 添加 一 个 结 点 ， 如 果 在 此 结构 中 删除 一 个 计算 机 用 户 ， 对 应 的 操作 是 删除 一 个 结 点 ， 在 
网 络 中 搜寻 一 台 计算 机 ， 对 应 的 操作 是 查询 等 。 

将 以 上 的 3 个 例子 简单 总 结 ， 可 以 说 在 处 理 数 学 模型 时 ， 首 先 应 该 保存 数学 模型 所 需 
要 的 必须 的 数据 ， 根 据 数据 在 计算 机 中 的 存储 ， 以 及 各 个 独立 的 数据 元 素 之 间 的 关系 ， 可 
以 将 数据 结构 分 为 线性 结构 和 非 线性 结构 。 

在 客观 世界 中 ， 如 何 体现 数据 之 间 的 关系 ， 需 要 计算 机 专业 人 员 对 数据 进行 分 析 时 分 类 
总 结 ， 以 便 更 加 深入 地 了 解 各 种 结构 的 特性 以 及 关系 。 从 不 同 的 角度 对 数据 结构 进行 分 类 ， 
最 终 的 目的 就 是 更 好 地 认识 各 种 结构 的 特性 及 关系 ， 而 在 设计 某 个 操作 时 ， 首 先 应 该 清楚 数 
据 元 素 之 间 具 有 的 逻辑 关系 ， 它 适合 什么 样 的 存储 结构 来 具体 实现 这 种 操作 。 同 时 同一 种 操 
作 在 不 同 的 存储 结构 中 实现 的 方法 可 以 不 同 ， 而 有 的 实现 则 完全 依赖 于 所 采用 的 存储 结构 ， 
所 以 研究 数据 之 间 的 关系 直接 影响 了 问题 的 求解 ， 由 此 可 见 数据 结构 的 重要 性 ， 

简单 地 说 ， 数 据 结构 是 研究 数据 的 存储 、 数 据 之 间 的 关系 及 对 数据 实现 各 种 操作 的 一 门 
学 科 。 
数据 结构 的 定义 可 以 记 作 : 


Data-Structure=(D,R) 
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其 中 ,DD 是 数据 元 素 的 有 限 集合 ，R 是 D 上 的 关系 。 : : 

一 般 情况 下 ，“ 关 系 ”是 指数 据 元 素 之 间 存在 的 多 辑 关系 ， 也 称 为 数据 的 逻辑 结构 ， 
数据 在 计算 机 内 的 存储 表示 (或 映像 ) 称 为 数据 的 存储 结构 或 物理 结构 。 

逻辑 结构 体现 的 是 数据 元 素 之 间 的 逻辑 关系 , 换 句 话说 就 是 从 操作 对 象 中 抽象 出 来 的 数 
学 模型 ， 因 此 又 称 为 抽象 结构 ， 通 常 我 们 习惯 说 的 数据 结构 一 般 就 是 指 的 逻辑 结构 。 然 而 讨 
论 数据 结构 的 目的 是 为 了 在 计算 机 中 实现 对 数据 的 操作 ， 因 此 还 需要 研究 数据 的 存储 结构 。 

存储 结构 是 数据 在 计算 机 内 的 表示 (映像 )， 又 称 物理 结构 。 它 包括 数据 元 素 的 表示 和 关 
系 的 表示 。 由 于 映像 的 方法 不 同 ， 所 以 同一 种 逻辑 结构 可 以 映像 成 两 种 不 同 的 存储 结构 : 顺 
序 映像 (顺序 存储 结构 ) 和 非 顺序 映像 ( 非 顺 序 存储 结构 )。 顺 序 映像 的 特点 是 在 顺序 存储 结构 
(一 般 用 一 维 数组 ) 中 体现 数据 之 间 的 关系 ， 而 非 顺序 存储 结构 则 一 般 采 用 指针 实现 数据 之 间 
的 关系 ， 包 括 链 式 存储 结构 (链表 ) 和 散 列 结构 等 。 数 据 的 存储 结构 要 能 够 正确 反映 数据 元 素 
之 间 的 逻辑 关系 。 也 就 是 说 ,数据 的 逻辑 结构 和 数据 的 存储 结构 是 密 不 可 分 的 两 个 方面 ， 任 
何 一 种 算法 的 设计 取决 于 选 定 的 逻辑 结构 ， 而 算法 的 实现 则 依赖 于 采用 的 存储 结构 。 

顺序 映像 (顺序 存储 结构 ) 是 借助 元 素 在 存储 器 中 位 置 表示 数据 元 素 之 间 的 逻辑 关系 ， 
或 逻辑 上 相 邻 的 结 点 存储 在 物理 位 置 上 相 邻 的 存储 单元 里 ， 结 点 的 逻辑 关系 由 存储 单元 的 
邻接 关系 来 体现 ， 而 非 顺 序 映像 ( 链 式 存储 结构 ) 是 借助 元 素 存储 地 址 的 指针 表示 元 素 之 间 
的 逻辑 关系 ， 或 逻辑 上 相 邻 的 结 点 在 物理 位 置 上 可 相 邻 ， 可 不 相 邻 ， 逻 辑 关系 由 附加 的 指 
针 段 表 示 。 例 如 图 1-4 所 示 。 
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101 


102 
103 





(a) 顺序 映像 示意 图 (b) 非 顺序 映像 示意 图 
图 1-4 顺序 存储 和 非 顺 序 存储 迎 辑 图 


_ 雪 所 的 大 序 存 入 结构 除 包括 甸 式 存储 结构 (你 甸 ) 以 外 ， 中 有 有 散 列 伍 悄 结构 、 索 
引 存 储 结构 等 。 

链 式 存储 结构 利用 指针 直接 表示 数据 元 素 之 间 的 关系 ， | 

散 列 结构 的 基本 思想 是 根据 结 点 的 关键 字 , 利用 散 列 函数 直接 计算 出 该 结 点 的 存储 地 址 ， 

索引 存储 结构 是 指 在 存储 结 点 信息 的 同时 ， 还 建立 附加 的 索引 表 。 索 引 表 的 每 一 项 称 
为 索引 项 ， 索 引 项 的 一 般 形 式 是 : (关键 字 ， 地 址 )。 关 键 字 是 能 够 惟一 标识 一 个 结 点 的 那 
些 数据 项 集合 。 索 引 存 储 结构 分 为 稠密 索引 和 稀疏 索引 ， 其 中 稠密 索引 是 指 每 个 结 点 在 索 
引 表 中 都 有 一 个 索引 项 的 索引 表 ， 而 稀疏 索引 是 指 一 组 结 点 在 索引 表 中 对 应 一 个 索引 项 的 
索引 表 。 


第 1 章 数据 结构 概论 “5。 


针对 存储 结构 ， 数 据 元 素 存储 在 计算 机 中 ， 应 对 每 个 数据 元 素 确定 其 取 值 范围 以 及 在 
值 上 定义 的 一 组 操作 就 是 数据 类 型 。 数 据 类 型 是 和 数据 结构 密切 相关 的 一 个 概念 ， 用 以 刻 
画 (程序 ) 操 作对 象 的 特征 。 在 用 高 级 语言 编写 的 程序 中 ， 每 个 变量 、 常 量 或 表达 式 都 有 一 
个 它 所 属 的 数据 类 型 ， 类 型 明显 或 隐 含 地 规定 了 在 程序 执行 期 间 变 量 或 表达 式 所 有 可 能 的 
取 值 范围 ， 以 及 在 这 些 值 上 允许 执行 的 操作 。 因 此 数据 类 型 是 指 一 个 值 的 集合 以 及 在 这 些 
值 上 定义 的 一 组 操作 的 总 称 。 例 如 Java 语言 中 有 整数 类 型 、 字 符 类 型 、 逻 辑 类 型 等 。 

数据 类 型 根据 是 否 允 许 分 解 分 为 原子 类 型 和 结构 类 型 ， 其 中 原子 类 型 是 指 其 值 不 可 再 
分 的 数据 类 型 ， 例 如 整 型 、 字 符 型 等， 而 结构 类 型 是 指 其 值 可 以 再 分 解 为 若干 成 分 (分 量 ; 
的 数据 类 型 ， 例 如 数组 的 值 由 若干 分 量 组 成 。 

实际 上 计算 机 中 数据 类 型 的 概念 不 仅 局 限 在 高 级 语言 中 ， 从 计算 机 和 程序 设计 用 户 的 
角度 来 说 ，“ 位 ”、“ 字 节 ”、“ 字 ”是 计算 机 硬件 的 原子 类 型 ， 程 序 设计 用 户 中 使 用 的 
高 级 语言 提供 的 数据 类 型 需要 编译 或 解释 转化 为 更 低级 语言 (汇编 或 机 器 语言 ) 的 数据 类 型 
来 实现 。 这 样 对 使 用 者 来 说 ， 不 必 了 解数 据 关 型 在 计算 机 内 的 表示 ， 也 不 必 了 解数 据 类 型 
的 操作 实现 ， 实 现 了 信息 的 隐蔽 ， 方 便 了 用 户 使 用 . 

根据 数据 的 结构 (逻辑 结构 和 存储 结构 ) 特 性 在 数据 的 生存 期 间 的 变动 情况 ， 可 将 数据 
结构 分 为 静态 结构 和 动态 结构 。 静 态 结构 是 指 在 数据 存在 期 不 发 生 任何 变动 ， 例 如 高 级 语 
言 中 的 静态 数组 ; 而 动态 结构 是 指 在 一 定 范围 内 结构 的 大 小 可 以 发 生变 动 , 如 使 用 的 堆栈 。 

总 之 ， 数 据 结构 所 要 研究 的 主要 内 容 简单 归纳 为 以 下 3 个 方面 

。 研究 数据 元 素 之 间 的 客观 联系 (逻辑 结构 ); 

。 研究 数据 在 计算 机 内 部 的 存储 方法 (存储 结构 ); 

。 研究 如 何在 数据 的 各 种 结构 (地 辑 的 和 物理 的 ) 上 实施 有 效 的 操作 或 处 理 (算法 ) 

所 以 数据 结构 是 一 门 抽象 地 研究 数据 之 问 的 关系 的 学 科 


1.2 ”数据 结构 的 发 展 史 及 其 在 计算 机 科学 中 的 地 位 


数据 结构 作为 一 门 独 立 的 课程 始 于 1968 年 ， 在 我 国 ， 数 据 结 构 作为 一 门 独立 课程 是 
在 20 世纪 80 年 代 初 ， 早 期 的 数据 结构 对 课程 的 范围 没有 明确 的 规定 ， 数 据 结构 的 内 容 几 
平和 图 论 、 树 的 理论 是 相同 的 ， 在 20 世纪 60~70 年 代 ， 随 着 大 型 程序 的 出 现 ， 软 件 也 相 
对 独立 ， 结 构 程序 设计 逐步 成 为 程序 设计 方法 学 的 主要 内 容 ， 和信 们 已 经 认识 到 程序 设计 的 
实质 就 是 对 所 确定 的 问题 选择 一 种 好 的 结构 ， 从 而 设计 一 种 好 的 算法 。 

自前 在 我 国 的 高 等 教育 体系 中 ， 数 据 结构 不 仅 作为 计算 机 专业 教学 计划 中 的 重点 核心 
课程 之 一 ， 而 且 也 开始 成 为 许多 非 计 算 机 专业 的 主要 选修 课程 。 在 计算 机 专业 中 它 是 在 程 
的 专业 基础 课 ， 它 为 从 事 各 类 系统 软件 和 应 用 
软件 的 设计 提供 了 必 备 的 知识 和 方法 。 

数据 结构 在 计算 机 科学 领 领域 中 有 着 十 分 重要 的 地 位 ， 它 有 自己 的 理论 、 研究 对 象 和 应 
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用 范围 ， 它 的 内 容 也 随 着 计算 机 技术 的 飞速 发 展 而 不 断 地 扩充 ， 从 包括 网 络 、 集 合 代 数论 
等 离散 结构 的 内 容 到 包括 数据 库 的 内 容 等 。 

数据 结构 课程 一 艇 的 前 序 课程 是 离散 数学 和 程序 设计 基础 ， 后 序 课程 有 操作 系统 、 编 
译 原 理 、 数 据 库 原理 等 。 数 据 结构 的 研究 不 仅 涉及 到 四 
计算 机 硬件 (特别 是 编码 理论 、 存 储 装 置 和 存 取 方 法 等 ) 
的 研究 范围 ， 而且 和 和 计算 机 软件 有 着 更 密切 的 关系 ， 
无 论 是 编译 原理 还 是 操作 系统 ， 都 涉及 数据 元 素 在 存 
储 器 中 的 分 配 问题 。 即 使 在 研究 信息 检索 时 也 必须 考 
起 如 何 组 织 数据 ， 以 便 查 找 和 存 取 数 据 元 素 更 为 方便 。 
因此 数据 结构 是 介 于 数学 、 计 算 机 硬件 和 计算 机 软件 ”图 1-5 .数据 结构 所 处 的 位 置 
之 间 的 一 门 核心 课程 (如 图 1-5 所 示 )。 .| / 

值得 注意 的 是 ， 数 据 结 构 的 发 展 并 未 终结 ， 一 方面 ， 面 向 专门 领域 中 的 特殊 问题 的 数 
据 结 构 得 到 研究 和 发 展 ， 如 多 维 图 形 数 据 结 构 等 ， 另 一 方面 ， 从 抽象 数据 类 型 观念 讨论 数 
据 结构 ， 局 起 来 越 被 人们 所 重视 。 





1.3 基本 概念 和 术语 


数据 在 计算 机 科学 中 是 指 输入 到 计算 机 中 并 能 够 被 计算 机 识别 、 存 储 和 加 工 处 理 的 符 
号 的 总 称 ， 例 如 一 个 整数 或 一 个 实数 。 对 计算 机 科学 而 言 ， 数 据 的 定义 非常 广泛 ， 计 算 机 
所 能 接受 的 所 有 符号 ， 如 我 们 说 话 ， 写 的 字 ， 日常 生活 中 看 到 的 图 像 等 ， 都 可 以 通过 编码 
的 方式 存储 在 计算 机 中 ， 所 以 它们 统称 为 数据 结构 中 的 数据 。 

数据 元 素 是 数据 的 基本 单位 ， 通 常 把 数据 元 素 作为 一 个 整体 进行 考虑 和 处 理 。 例 如 文 。 
件 中 的 记录 可 以 看 作 是 一 个 整体 数据 元 素 通常 可 以 理解 为 逻辑 意义 上 的 数据 的 基本 单位 ， 
而 不 是 物理 意义 上 的 基本 数据 单位 。 ““ : 

数据 元 素 可 由 一 个 或 多 个 数据 项 组 成 。 也 就 是 说 ， 数 据 的 基本 物理 单位 是 数据 项 。 数 
据 项 (或 数据 元 素 ) 是 指 具 有 独立 含义 的 最 小 识别 单位 (数据 中 不 可 分 割 的 最 小 单位 )。 例 如 文 
件 记录 中 的 某 一 列 ， 所 以 数据 项 又 称 项 或 字段 。 

数据 项 有 逻辑 形式 (logical form) 和 物理 形式 (physical form) 两 个 方面 .用 ADT 给 出 的 数 
据 项 的 定义 是 它 的 逻辑 形式 ， 数 据 结构 中 对 数据 项 的 实现 是 它 的 物理 形式 。 

结构 通常 是 指 关 系 ， 所 以 数据 结构 是 指数 据 之 闻 的 关系 的 一 门 学 科 ， 它 表示 的 是 数据 
之 间 的 相互 形式 ， 即 数据 的 组 织 形式 。 数 据 结构 可 以 从 不 同 的 角度 进行 分 类 ， 一 般 从 用 户 
的 角度 和 计算 机 的 角度 来 划分 数据 结构 的 分 类 : 从 用 户 的 角度 来 说 ， 主 要 关心 的 是 数据 元 
素 之 间 的 关系 ， 所 以 数据 结构 称 为 逻辑 结构 (或 抽象 结构 )， 其 作用 是 研究 数据 元 素 之 间 的 
逻辑 (或 抽象 ) 关 系 ， 而 从 计算 机 的 角度 来 说 ， 主 要 关心 的 是 数据 元 素 及 其 关系 在 计算 机 内 
如 何 存储 ， 称 为 存储 结构 (或 物理 结构 )， 其 作用 是 数据 元 素 及 其 关系 在 计算 机 内 的 表示 。 
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如 果 从 数据 结构 是 否 变 化 来 分 类 ， 可 以 把 数据 结构 划分 为 静态 结构 和 动态 结构 。 所 谓 静 态 
结构 是 指数 据 结构 在 存在 期 间 不 会 发 生变 动 ， 如 静态 数组 ， 不 会 随 着 操作 的 进行 而 改变 数 
组 的 大 小 。 而 动态 结构 是 指 在 一 定 范 围 内 结构 的 大 小 要 发 生变 动 ， 如 堆栈 、 队 列 以 及 树 型 
结构 等 都 属于 动态 结构 的 范畴 。 

根据 数据 结构 是 研究 数据 及 其 关系 的 一 门 学 科 的 定义 ， 了 解数 据 是 对 客观 事物 的 符号 
表示 是 非常 必要 的 。 数 据 在 计算 机 中 存储 必须 按照 数据 的 分 类 存储 ， 数 据 分 类 应 该 用 数据 
类 型 划分 ， 数 据 类 型 用 以 刻画 (程序 ) 操 作对 和 象 的 特性 ， 在 高 级 语言 编写 的 程序 中 ， 每 个 变 
量 或 表达 去 都 有 一 个 它 所 属 的 确定 的 数据 类 型 ， 类 型 明显 或 隐 含 地 规定 了 在 程序 执行 期 间 
变量 或 表达 式 所 有 可 能 的 取 值 范围 ， 以 及 在 这 些 值 上 允许 进行 的 操作 。 因 此 数据 类 型 是 一 
个 值 的 集合 和 定义 在 这 个 值 集合 上 的 一 组 操作 的 总 称 。 如 程序 语言 中 的 整 型 变量 、 字 符 型 
变量 ， 部 确定 了 数据 的 取 值 范围 。 : 

按照 值 的 不 同属 性 ， 数 据 类 型 可 以 分 为 两 类 : 原子 类 型 和 结构 类 型 。 原 子 类 型 的 值 是 
不 可 分 解 的 ， 如 高 级 语言 中 基本 数据 类 型 ( 整 型 、 字 符 型 等 ); 结构 类 型 是 由 若干 成 分 按 某 
种 结构 组 成 的 ， 是 可 以 分 解 的 。 

实际 上 ， 在 计算 机 中 ， 数 据 类 型 的 概念 并 非 局 限 在 高 级 语言 中 ， 计 算 机 的 硬件 和 软件 
系统 都 提供 了 一 组 原子 类 型 或 结构 类 型 ， 例 如 “位 ”、“ 字 节 ”、“ 字 ”等 属于 原子 类 型 ， 
它们 的 操作 通过 计算 机 设计 的 指令 直接 由 电路 系统 完成 ， 而 高 级 语言 提供 的 数据 类 型 则 是 
通过 编译 或 解释 器 转化 为 低层 (汇编 语言 或 机 器 语言 ) 的 数据 类 型 来 实现 。 

在 存储 结构 中 包括 了 数据 元 素 的 表示 和 数据 元 素 之 间 的 关系 表示 。 数 据 元 素 存储 在 计 
算 机 中 ， 计 算 机 中 表示 信息 的 最 小 单位 是 二 进 制 数 的 一 位 ， 称 为 位 (bit}y， 由 若干 位 组 成 一 
个 位 串 表 示 一 个 数据 元 素 ， 称 为 元 素 或 结 点 ， 当 数据 元 素 由 若干 个 数据 项 组 成 时 ， 对 应 于 
各 个 数据 项 的 子 位 串 称 为 数据 域 。 在 非 顺 序 映像 中 借助 指示 元 素 存储 地 址 ， 描 述 数据 元 素 
之 间 逻 和 辑 天 系 的 部 分 称 为 指针 域 。 结 点 也 可 以 描述 为 数据 处 理 的 数据 单位 ， 它 可 能 是 一 条 
记录 、 一 个 数据 项 或 组 合 数据 项 。 对 应 结 点 定义 根据 结 点 所 处 位 置 的 不 同 可 以 将 表 中 的 结 
点 分 为 前 趋 和 后 继 络 点 ， 对 表 中 任意 结 点 ， 处 于 该 结 点 之 前 的 所 有 结 点 称 为 该 结 点 的 前 趋 
络 点 ， 而 处 于 该 结 点 之 后 的 所 有 结 点 称 为 该 结 点 的 后 继 结 点 ， 与 之 相 邻 的 前 趋 结 点 称 为 直 
搁 前 趋 结 点, 而 与 之 相 邻 的 后 继 结 点 称 为 直接 后 继 结 点 。 表 中 的 第 一 个 结 点 称 为 开始 结 点 ， 
表 中 最 后 一 个 没有 后 继 的 结 皮 称 为 终端 结 点 。 


1.4 ”抽象 数据 类 型 和 数据 结构 


数据 类 型 是 指 一 个 值 的 集合 以 及 在 这 些 值 上 定义 的 一 组 操作 的 总 称 。 抽 象 数据 类 型 
(Abstract Data Type，ADT) 是 指 抽象 数据 组 织 和 与 之 相关 的 操作 。 每 一 个 操作 由 它 的 输入 
和 输出 定义 。 抽 象 数据 类 型 的 定义 取决 于 它 的 一 组 逻辑 特性 ， 而 与 其 在 计算 机 内 的 表示 和 
实现 无 和 天， 也 就 是 说 ， 无 论 其 内 部 结构 如 何 变 化 ， 只 要 其 数学 特性 不 变 ， 都 不 影响 其 外 部 


8。 数据 结构 与 算法 分 析 (Java 版 ) 


的 使 用 。 或 者 说 一 个 ADT 的 定义 不 涉及 它 的 实现 细节 ， 这 些 实现 细节 对 ADT 的 用 户 是 隐 
藏 的 。 隐 藏 实现 细节 的 过 程 称 为 封装 。 数 据 结 构 是 ADT 的 物理 实现 。 : 

抽象 数据 类 型 和 数据 类 型 实质 上 是 一 个 概念 。 例 如 计算 机 中 的 “整数 ”类 型 是 一 个 抽 
象 类 型 ， 尽 管 它 们 在 不 同 的 处 理 器 上 实现 的 方法 不 同 ， 但 由 于 其 定义 的 数学 特性 相同 ， 在 
用 户 看 来 都 是 相同 的 。 因 此 抽象 的 意义 在 于 数据 类 型 的 数学 抽象 特性 。 

抽象 数据 类 型 的 定义 仅 取决 于 它 的 半 “组 逻辑 特性 ， 而 与 其 在 计算 机 内 部 如 何 表示 和 实 
现 无 关 ， 即 不 论 其 内 部 结构 如 何 变化 ， 只 要 其 数学 特性 不 变 ， 都 不 影响 其 外 部 的 使 用 。 

男 一 方面 ， 抽 象 数据 类 型 比 数据 类 型 的 范畴 更 广 ， 它 不 仅 局 限 在 处 理 器 中 已 经 定义 并 
实现 的 数据 类 型 ， 还 包括 用 户 在 设计 软件 时 自己 定义 的 数据 类 型 。 一 个 软件 系统 的 框架 应 
建立 在 数据 之 上 ， 而 不 应 该 建立 在 操作 之 上 。 所 以 定义 的 数据 类 型 的 抽象 的 层次 越 高 ， 含 
有 该 抽象 数据 类 型 的 软件 模块 的 复 用 程度 也 就 越 高 。 

”抽象 数据 类 型 可 以 定义 为 : 


(DS,P) 


其 中 ，D 表示 数据 对 象 ，S 是 D 上 的 关系 集 ，P 是 对 DD 的 基本 操作 集 ， 
ADT 使 用 伪 码 描述 为 ; 


ADT 抽象 数据 类 型 名 { 
数据 对 象 :< 数据 对 象 的 定义 > 
数据 关系 :< 数据 关系 的 定义 > 
基本 操作 :< 基本 操作 的 定义 > 
}ADT 抽象 数据 类 型 名 


抽象 数据 类 型 的 定义 由 一 个 值 域 和 定义 在 该 值 域 上 的 一 组 操作 组 成 ， 如 果 按 照 其 值 的 
不 同 特 性 ， 可 细 分 为 3 种 类 型 。 

e 原子 类 型 属于 原子 类 型 的 变量 的 值 是 不 可 再 分 的 。 

e 固定 聚合 类 型 ， 属于 该 类 型 的 变量 的 值 由 确定 数目 的 成 分 按照 某 种 结构 组 成 。 

e 可 变 聚 合 类 型 : 属于 该 类 型 的 变量 的 值 的 成 分 数目 不 确定 ， 其 中 序列 的 长 度 是 可 变 

的 ， 

后 两 种 类 型 可 统称 为 结构 类 型 。 

例 1: 整数 的 数学 概念 和 施加 到 整数 的 运算 构成 一 个 ADT。Java 的 变量 类 型 int 就 是 
对 这 个 抽象 类 型 的 物理 实现 。 但 int 型 变量 有 一 定 的 取 值 范围 ， 所 以 对 这 个 抽象 的 整 型 的 
实现 并 不 完全 正确 ， 如 果 无 法 接受 该 限制 ， 就 必须 引进 一 些 其 他 的 实现 方法 来 实现 这 个 抽 
象 类 型 。 

例 2: 一 个 整数 线性 表 的 ADT 应 包含 下 列 操 作 。 

e 数据 的 存储 结构 确定 线性 关系 。 

e 把 一 个 新 整数 插入 到 表 尾 。 

_@ 按 线性 表 的 元 素 顺 序 依次 打印 。 
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e 删除 线性 表 的 某 个 元 素 。 

e 查找 线性 表 的 某 个 元 素 ， 成 功 返回 true， 失 败 返 回 false。 

e 将 线性 表 的 整数 排序 。 

通过 上 述 的 描述 ， 每 个 操作 的 输入 和 输出 清晰 可 见 ， 但 是 对 整数 线性 表 的 实现 过 程 并 
没有 详细 说 明 。 

例 3: 抽象 数据 类 型 的 三 元 组 定义 。 


ADT Tri 
数据 对 象 ， D={el ez, e3| ely ez, edEelementset( 已 经 定义 的 数据 集合 人 
数据 关系 ，R1={<el ez> R2= < e@,,e;>)} 
基本 操作 : 
imtn(&t,v1,v2,v3) 
结果 : 构造 三 元 组 t， 并 将 v1、v2、v3 赋值 给 el/、e,、e; 完成 初始 化 。 
tansporttri(m,&t) 
结果 ; 将 矩阵 M 转 置 为 下 。 
addtri(m,n,&q) : 
结果 : 求 矩 隆 m 和 mn 和， 结果 放 在 q 中。 
JADT tri 


对 应 的 各 种 操作 ， 用 户 自 己 编写 出 来 即 可 。 


ADT 的 概念 就 是 将 复杂 的 问题 抽象 化 。 抽象 化 之 后 的 问题 是 使 我 们 重视 问题 而 忽略 不 
必要 的 细 市 。 


ADT 不 同 于 类 ， 其 区 别 在 于 ADT 相当 于 在 概念 层 (或 为 抽象 层 ) 上 描述 问题 ， 而 类 相 
当 于 在 实现 层 上 描述 问题 。 


Java 语言 作为 面向 对 象 的 程序 设计 语言 ， 它 提供 了 许多 特性 来 支持 封装 。 读 者 只 要 具 
备 结构 化 的 程序 设计 语言 (如 Pascal 或 C) 的 编程 经 验 , 应 该 比较 容易 理解 本 书 的 算法 实现 。 


1.5 “学 习 数据 结构 的 意义 





数据 结构 是 计算 机 专业 的 核心 课程 之 一 ， 在 众多 的 计算 机 系统 软件 和 应 用 软件 中 者 用 
到 各 种 数据 结构 。 

著名 的 瑞士 计算 机 科学 家 N.Wirth 曾 提出 ， 算 法 + 数据 结构 = 程序 。 其 中 数据 结构 是 指 
数据 逻辑 结构 和 物理 结构 ， 算法 是 对 数据 运算 的 描述 。 由 此 可 见 ， 程 序 设计 的 实质 是 对 具 
体 问 题 选 择 一 种 好 的 数据 结构 ， 再 设计 一 个 好 的 算法 ， 而 好 的 算法 通常 取决 于 实际 问题 的 
数据 结构 。 下 面 以 两 个 例子 加 以 说 明 。 

例 1 电话 号 码 的 查询 问题 。 

假设 编写 一 个 程序 ， 查询 某 个 城市 或 私人 的 电话 号 码 。 对 任意 给 出 的 一 个 姓名 ， 若 该 
人 有 电话 号 码 ， 则 要 迅速 地 找到 其 电话 号 码 ， 否 则 指出 该 人 没有 电话 号 码 。 
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解决 此 问题 首先 要 构造 一 张 电 话 号 码 登 记 表 ， 表 中 每 个 结 点 至 少 存放 两 个 数据 项 : 
姓名 和 电话 号 人 个。 要 写 出 好 的 查找 算法 ， 取 决 于 这 张 表 的 结构 及 存储 方式 。 我 们 考虑 两 
种 方法 : : 
“” {1) 将 表 中 结 点 顺序 地 存储 在 计算 机 中 。 

查找 方法 是 从 头 开 始 依次 租 对 姓名 ， 直 到 找 出 正确 的 姓名 或 是 找 遍 整个 表 均 没有 找到 
为 止 。 这 种 王 找 算法 对 于 一 个 不 大 的 单位 或 许 是 可 行 的 ， 但 对 一 个 有 成 千 上 万 私人 电话 的 
城市 就 不 实用 了 。 

(2) 大 这 张 表 是 按 姓氏 排列 的 ， 则 我 们 可 以 另 造 一 张 姓氏 索引 表 ， 采 用 如 图 1-6 所 示 
的 存储 结构 。 





图 1-6 电话 号 人 码 僵 询 索 引 存 储 图 


查找 过 程 是 先 在 索引 表 中 查 对 姓氏 ， 然 后 根据 索引 表 中 的 地 址 到 电话 号 码 登记 表 中 核 
查 姓名 ， 这 样 查找 登记 表 时 就 无 需 查找 其 他 姓氏 的 名 字 了 。 因 此 ， 在 这 种 新 的 结构 上 产生 
的 查找 算法 就 更 为 有 效 。 
例 2: 田径 赛 的 时 间 安 排 问题 。 

”假设 某 校 的 田径 选拔 赛 共 设 6 个 项 目的 比赛 ， 即 跳高 、 跳 远 、 标 枪 、 铅 球 、100 米 和 
200 米 短跑 ， 规 定 每 个 选手 至 多 参加 3 个 项 目的 比赛 。 现 有 5 名 选手 报名 参赛 ， 选 手 所 选 
择 的 项 目 如 表 1-1 所 示 。 现 在 要 求 设计 二 个 竞赛 日 程 安排 表 ， 使 得 在 尽 可 能 短 的 时 间 内 安 
排 完 比赛 。 


表 1-1 参赛 选手 比赛 项 目 表 


姓 名 | 项 1 | 项 2 项 目 3 
刘晓东 | 跳高 100m 
马 明 

张 文 标枪 200m 
李 文 化 跳高 


为 了 能 较 好 地 解决 这 个 问题 ， 首 先 应 该 选择 一 个 合适 的 数据 结构 来 表示 它 。 为 此 ， 根 
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据 表 1-1 我 们 可 以 设计 这 样 的 一 个 图 (如 图 1-7 所 示 )， 其 中 顶点 表示 竞赛 项 目 (a、b、c、d、 
e、f 分别 表示 6 种 竞赛 项 目 )， 显 然 每 个 人 不 可 能 同时 参加 两 个 项 目的 竞赛 ， 在 所 有 不 能 同 
时 比赛 的 项 目 之 间 连 上 一 条 边 。 





1-7 竞赛 项 目的 数据 结构 模型 


假设 用 每 一 种 颜色 表示 相同 时 间 ， 我 们 可 以 使 用 尽 可 能 少 的 颜色 为 每 个 顶点 着 色 ， 使 
得 任意 一 条 边 连 接 的 两 个 顶点 颜色 不 同 ， 相 同 颜色 的 顶点 (竞赛 项 目 ) 可 以 安排 在 同一 个 时 
闻 。 例 如 a 和 不 相 邻 ， 可 以 是 同一 种 颜色 ，b 和 d 可 以 是 同一 种 颜色 ; e 和 f 相 邻 ， 分 别 
用 两 种 颜色 。 也 就 是 说 ， 总 共 可 以 使 用 4 种 颜色 描述 。 

数据 结构 包括 了 逻辑 结构 、 存 储 结构 和 算法 。 解 决 问 题 的 关键 是 : 选择 合适 的 数据 结 
构 表 示 问 题 ， 然 后 写 出 有 效 的 算法 。 


1.6 Java 语音 概述 


1.6.1 面 问 对 象 的 程序 设计 


Java 是 一 种 面向 对 象 的 程序 设计 语言 ， 在 该 语言 中 : 

e 每 个 数据 项 均 封 装 在 某 个 对 象 中 。 

e 每 条 可 执行 的 语句 均 由 某 个 对 象 来 完成 。 

e 每 个 对 象 均 是 某 个 类 的 实例 或 是 一 个 数组 。 

e 每 个 尖 均 在 一 个 单 继承 的 层次 结构 中 定义 。 

Java 中 的 单 继承 层次 结构 是 一 种 树 型 结构 ， 它 的 根 是 object 类 。Java 的 面向 对 象 的 特 
凡 使 得 它 特别 适合 于 数据 结构 的 设计 和 实现 ， 为 程序 员 提 供 了 很 好 的 开发 平台 。 / 


1.6.2 ”变量 和 对 象 


一 个 Java 程序 由 一 个 或 多 个 文本 文件 组 成 ， 其 中 全 少 有 一 个 文本 文件 包含 了 一 个 
public 类 (惟一 的 一 个 )， 该 类 中 含有 惟一 的 一 个 main 方法 ， 典型 的 用 法 是 : : 


public static void main(string[] args) 
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程序 中 的 每 个 文件 必须 包含 一 个 惟一 的 public 类 或 public 接口 定义 。 对 X.java 的 文件 
而 言 , X 就 是 该 文件 中 定义 为 public 的 类 名 或 接口 名 。 文件 编 译 后 形成 .class 的 类 文件 。 程 
序 通 过 包含 main(string[]) 的 class 文件 执行 ,程序 既 可 以 在 命令 方式 下 执行 ， 又 可 以 在 集成 
开 友 环境 中 运行 。 

在 程序 设计 语言 中 ， 数 据 的 存 取 是 通过 变量 实现 的 。 在 Java 中 ， 一 个 变量 要 么 是 对 象 
的 一 个 引用 , 要 么 是 8 种 基本 类 型 之 一 。 如 果 变 量 是 一 个 引用 , 那么 它 的 值 要 么 为 空 (null)， 
要 么 包含 一 个 实例 对 象 的 地 址 。 

每 个 对 象 属 于 一 个 特定 的 类 ， 类 定义 了 对 象 的 特性 和 操作 :一 个 变量 是 由 说 明 其 类 型 
和 和 初 值 的 声明 来 定义 的 ， 对 象 由 调用 类 构造 器 的 new 操作 创建 。 

例 1: 创建 变量 和 对 象 。 


public class ex 
{public static void main(string[] args) 
{boolean flag=true; 
char ch='a'; 
Short m; 
int n=10; 
double xy; 
string Str; 
string nns=nuyll; | 
string country = new string ( CHINA yy 
system.out.printin("falg="+flag); 
system.out.printin("ch="+ch): 
system.out.println("n="+n); 
System.out.printin( "nns= "+nns); 
System.out.printljn( country= "+Ccountry ); 
) z 
4 


该 例 中 定义 了 8 个 变量 ， 前 5 个 变量 是 基本 类 型 变量 ， 后 3 个 变量 是 指向 字符 串 的 对 
象 的 引用 。 
“Java 定义 了 8 种 基本 类 型 
boolean 布尔 型 ， 其 值 为 false 或 true。 
char 字符 型 。 
byte 8 位 整数 ， 取 值 范围 是 - 128~127。 
short 16 位 整数 ， 取 值 范 围 是 - 32768~32767。 
int 32 位 整数 。 
long 64 位 整数 。 
float 32 位 浮 点 小 数 。 
double ”64 位 浮 点 小 数 。 
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1.6.3 ”流程 控制 


在 条 件 分 支 中 ，Java 语言 中 有 f 语 句 、if…else 语句 、switch 语句 以 及 条 件 表 达 式 运算 
人 和 f ‘eo 。 py , 
在 循环 中 ，Java 语句 支持 while 语句 、do*…while 语句 和 for 循环 语句 。 
例如 :分支 和 循环 的 使 用 。 


public class examp1l 
public static vold main(string[] args) 
int n=(Int )math.round( 100*math.random'()); 
让 (n>25)&&(n<75) 
system.out.printlIn(n+"is between 25 and 75"); 
else | 
system.out.println(nt+"is not between 25 and 75"): 
switch ((int) n/20 ) 
case 0: 
system.out.printIin(n+"<20"); 
case 1: 
system.out.printlIn(n+"<40"); 
case 2: 
system.out.printin(n+"<60");, break: 
case 3: 
system.out.printin(n+"<80");break.: 
default: 
system.out.println(n+">=80"); 
) 
while (n<=100) 
{ 
system.out.println("n="+n); 
nn 二 十; 
} 
for (nt j=1;]<=n;j++) 


System.out.prtntln( n= 上 mn); 





1.6.4 ”类 和 修饰 全 


一 个 类 是 一 个 抽象 数据 类 型 的 实现 ， 对 象 是 通过 对 类 进行 实例 化 产生 的 ， 在 类 定义 中 
指明 了 该 类 的 对 象 所 能 保持 的 数据 的 种 类 和 对 象 所 能 完成 的 操作 , 这 些 摘 述 成 为 类 的 成 员 。 

如 1.4 节 中 的 ADT 定义 ， 一 个 类 可 以 包含 存储 的 数据 集合 ， 也 可 以 包含 在 此 数据 集合 
上 的 一 系列 的 基本 操作 。 

对 类 、 接 口 及 其 成 员 进 行 声明 时 ， 均 可 以 珊 上 修饰 竺 ， 这 些 修饰 符 可 以 包含 public、 
protected、private、abstract、package、static 以 及 final。 z 

其 中 public、protected、private 称 做 存 取 访问 修饰 符 。 因 为 它们 将 确定 类 或 成 员 从 哪 
些 地 方 来 进行 访问 。public 可 以 用 来 目 任 何 地 方 的 访问 ，protected 只 能 被 本 类 或 该 类 的 子 
类 的 方法 访问 ，private 则 只 能 由 该 类 自身 访问 。 

当成 员 声 明 为 abstract 时 ， 表 明 它 是 不 完整 的 。 意 味 看 没有 包括 它 的 实现 。 应 该 说 明 
的 是 : field 不 能 为 abstract。 : : 

一 个 final 类 是 指 不 能 有 子 类 的 类 ， 而 一 个 final 的 field 表示 它 是 一 个 常量 。 

一 个 static 型 的 field 成 员 是 属于 关 本 身 的 ， 而 不 是 为 该 类 的 每 个 实例 对 象 产生 一 个 单 
独 的 备份 。 


1.7 算 法 


1.7.1 算法 及 其 性 质 


如 果 问 题 是 一 个 需要 完成 的 任务 ， 即 对 应 一 组 输入 就 有 一 组 相应 的 输出 。 只 有 问题 被 
准确 定义 并 完全 理解 后 才能 够 研究 问题 的 解决 方法 。 例 如 ， 任 何 计 算 机 程序 只 能 使 用 可 用 
的 主 存储 器 和 磁盘 空间 ， 而 且 必 须 在 合理 的 时 间 内 完成 运行 。 

从 数学 的 角度 讲 ， 可 以 把 问题 看 作 函 数 。 函 数 是 输入 (定义 域 ，domain) 和 输出 ( 值 域 ， 
range) 之 则 的 一 种 映射 关系 。 输 入 值 称 为 函数 的 参数 ， 不 同 输入 可 以 产生 不 同 的 输出 ， 但 
是 给 定 的 输入 ， 每 次 必须 有 相同 的 输出 。 

算法 是 指 解决 问题 的 一 种 方法 或 者 一 个 过 程 。 一 个 问题 可 以 用 多 种 算法 来 解决 ， 一 个 
给 定 的 算法 解决 一 个 特定 的 问题 。 

数据 结构 与 算法 之 间 存 在 着 密切 的 关系 。 可 以 说 不 了 解 施 加 于 数据 上 的 算法 需求 就 无 
法 决定 数据 结构 ， 反 之 算法 的 结构 设计 和 选择 又 依赖 于 作为 其 基础 的 数据 结构 。 即 数据 结 
构 为 算法 提供 了 工具 。 算 法 是 利用 这 些 工 具 来 实施 解决 问题 的 最 优 方案 。 因 为 在 程序 设计 
过 程 中 相当 多 的 时 间 花 费 在 算法 的 构思 上 ， 一 旦 有 了 比较 好 的 算法 (解决 问题 的 方法 )， 使 
用 具体 的 程序 设计 语言 实现 不 是 很 困难 的 事情 。 从 这 个 角度 来 说 , 只 有 设计 一 个 好 的 算法 ， 
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才 有 可 能 设计 出 一 个 好 的 程序 。 

简单 地 说 , 算法 就 是 解决 问题 的 方法 , 或 算法 是 解决 某 个 特定 问题 的 一 些 指令 的 集合 ; 
或 者 说 ， 由 人 们 组 织 起 来 加 以 准备 、 加 以 实施 的 有 限 的 基本 步骤 。 流 程 图 是 图 形 化 的 算法 ， 
程序 是 用 计算 机 语言 描述 的 算法 。 

在 计算 机 领域 内 ， 一 个 算法 实质 上 是 根据 处 理 问 题 的 需要 ， 在 数据 的 逻辑 结构 和 存储 
结构 的 基础 上 施加 的 一 种 运算 。 因 为 数据 的 逻辑 结构 和 存储 结构 不 是 惟一 的 ， 所 以 算法 的 
描述 可 能 不 惟一 。 即 使 逻辑 结构 和 存储 结构 相同 ,算法 可 能 也 不 惟一 。 通 过 学 习 数 据 结构 ， 
可 以 使 得 程序 设计 者 选择 一 种 比较 好 的 算法 ， 当 然 好 的 算法 是 根据 实际 的 硬件 和 软件 环境 
进行 衡量 的 。 

一 个 完整 的 算法 应 该 满足 以 下 几 条 性 质 ， 

(1) 正确 性 。 算 法 必须 完成 所 期 望 的 功能 ， 得 到 的 结果 必须 是 正确 的 。 

(2) 确定 性 。 组 成 算法 的 指令 必须 是 清晰 的 、 无 二 义 性 。 也 就 是 说 ， 算 法 的 每 一 个 步 
又 都 必须 准确 定义 。 准 确定 义 是 指 所 描述 的 行为 必须 对 人 或 机 器 而 言 是 可 读 的 、 可 执行 的 。 
每 一 步 必须 在 有 限 的 时 间 内 执行 完毕 ， 同 时 必须 是 我 们 力所能及 的 ， 能 够 依赖 于 具体 的 工 
具 来 执行 的 工序 。 算 法 的 指令 必须 具有 可 执行 性 ， 也 就 是 说 编写 的 算法 必须 是 计算 机 能 够 
执行 ， 否 则 为 无 效 算 法 。 | 

”(3) 有 穷 性 。 算 法 必须 在 有 限 的 步 又 内 结束 。 如 果 一 个 算法 由 无 限 的 步骤 组 成 ， 该 算 
法 不 可 能 有 计算 机 程序 实现 。 计算 机 只 能 解决 有 限 问题 ， 不 能 够 解决 无 限 问题 。 

(4) 输入 。 每 个 算法 可 以 包含 n(n 宇 0) 个 数据 的 输入 。 ” 

(5) 输出 。 算 法 至 少 有 一 个 输出 。 

值得 注意 的 是 ， 一 个 算法 可 以 没有 输入 (n=0)， 但 是 至 少 应 该 有 一 个 输出 。 如 果 算 法 没 
有 了 输出 ， 也 就 没有 结果 ， 该 算法 就 没有 了 实际 意义 。 

程序 可 以 看 作 是 使 用 某 种 程序 设计 语言 对 一 个 算法 的 具体 实现 。 所 以 就 有 人 说 
程序 = 算法 + 数据 结构 。 


1.7.2 算法 描述 的 分 析 


1. 算法 设计 要 求 


议 计 一 个 好 的 算法 通常 应 考虑 达到 以 下 目标 : | 

(1) 正确 性 。 算 法 设计 应 满足 具体 问题 的 需求 。 它 至 少 应 该 包括 对 输入 、 输 出 及 加 工 
过 程 等 的 明确 的 无 歧义 性 的 描述 。“ 正 确 ” 涵 义 通常 包含 程序 无 语法 错误 、 程 序 能 够 得 到 
正确 的 结果 、 程 序 对 不 合法 的 数据 输入 应 有 满足 要 求 的 结果 。 一 般 对 程序 测试 时 ， 以 录入 
不 合法 数据 得 到 满足 要 求 的 结果 作为 衡量 程序 是 否 合 格 的 标准 。 

(2) 可 读 性 。 算 法 主要 是 为 了 阅读 与 交流 ， 算 法 可 读 性 好 有 助 于 对 算法 的 理解 。 

(3) 健壮 性 。 当 输入 非法 的 数据 时 ， 算 法 能 够 适当 地 作出 反应 或 进行 处 理 ， 不 会 产生 
英名 其 妙 的 输出 结果 。 
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(4) 效率 与 低 存储 量 需 求 。 效 率 是 指 算法 的 执行 时 间 ， 一 般 对 问题 的 求解 方法 很 多 ， 
执行 时 间 短 的 算法 效率 高 。 存 储量 的 需求 是 指 算法 执行 过 程 所 需要 的 最 大 的 存储 容量 ， 存 
储 空间 越 小 ， 则 算法 越 好 。 效 率 和 低 存 储量 两 者 通常 情况 下 是 矛盾 的 。 也 就 是 说 ， 在 编写 
算法 时 ， 有 时 为 了 追求 较 少 的 运行 时 间 ， 可 能 会 占用 较 多 的 存储 空间 ; ， 当 追求 较 少 的 存储 
空间 时 ， 又 可 能 带 来 运算 时 间 增 加 的 问题 。 因 此 在 衡量 算法 好 与 坏 时 ， 应 该 综合 考虑 各 个 
方面 的 因素 ， 才 能 够 得 到 较 好 的 算法 。 时 间 和 存储 空间 两 者 都 与 问题 的 规模 有 关 。 


2. 算法 分 析 


算法 是 解决 计算 问题 的 工具 。 算 法 的 好 与 坏 直 接 影响 解决 问题 的 效率 ， 为 提高 解决 问 
题 的 效率 ， 针 对 一 个 具体 问题 的 解决 方法 ， 除 了 需要 考虑 对 算法 的 具体 描述 外 ， 还 应 具有 
衡量 该 算法 好 坏 的 方法 。 

一 个 算法 的 描述 可 以 考虑 各 种 具体 的 语言 或 类 语言 ， 一 般 情况 下 使 用 类 语言 的 较 多 。 
所 谓 类 语言 是 指使 用 高 级 语言 的 基本 语法 和 指令 ， 但 并 不 能 直接 在 机 器 上 运行 ， 如 果 需 要 
运行 ， 还 需要 按照 高 级 语言 的 严格 规定 进行 调试 方 可 。 例 如 : 循环 语句 一 般 有 for 语句 ， 
不 同 的 语言 其 格式 可 能 不 相同 。 

算法 的 分 析 主 要 是 指 判断 算法 的 优 劣 ， 判 断 一 个 算法 的 好 坏 一 般 从 两 个 方面 考虑 ， 虽 
从 时 间 角 度 和 从 空间 角度 上 衡量 算法 。 一 般 算法 分 析 从 时 间 角 度 考 虑 的 比较 多 。 当 然 判断 
一 个 算法 的 好 与 坏 ， 不 能 以 时 间或 空间 衡量 简单 化 ， 而 是 根据 实际 情况 综合 考虑 。 

度量 一 个 程序 的 执行 时 间 通 常 有 两 种 方法 : 

(1) 事后 统计 方法 。 这 种 方法 的 缺点 是 ， 必须 先 运行 依据 算法 编制 的 程序 ， 所 花 时 间 
的 统计 量 依赖 于 计算 机 的 软件 、 硬 件 等 环境 因素 ， 容 易 掩盖 算法 本 身 的 优 劣 。 因 此 人 们 党 
用 第 2 种 方法 。 

(2) 事前 分 析 佑 算 的 方法 。 一 个 用 高 级 语言 编写 的 程序 在 计算 机 上 运行 时 所 消耗 的 时 
间 取 决 于 下 列 因素 。 
算法 选用 何 种 策略 
问题 规模 
书写 程序 的 语言 
编译 产生 的 机 器 代码 质量 
机 器 执行 指令 的 速度 

一 个 算法 的 执行 时 间 按 照 以 上 5 点 衡量 是 不 合适 的 ， 因 为 在 不 同 的 计算 机 上 运行 同一 
个 程序 ， 其 时 间 可 能 不 同 。 但 是 如 果 撤 开 和 计算 机 软件 、 春 件 有 关 的 因素 ， 可 以 说 算法 效 
率 依赖 于 问题 的 规模 ， 或 者 说 ， 它 是 问题 规模 的 函数 。 

但 在 实践 中 ， 我 们 可 以 把 两 种 方法 结合 起 来 使 用 。 

一 般 地 ， 我 们 将 算法 的 求解 问题 的 输入 称 为 问题 的 规模 ， 并 用 一 个 整数 n 表示 。 例 
如 ， 算 阵 乘积 问题 的 规模 是 矩阵 的 阶 数 ， 而 一 个 图 论 间 题 的 规模 则 是 图 中 的 项 挟 个 数 或 
边 的 条 数 。 

在 算法 的 每 个 步骤 中 ， 可 能 有 若干 条 语句 ， 而 频 度 就 是 指 每 条 语句 的 执行 次 数 。 
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算法 的 时 间 复 杂 度 是 指 算法 的 时 间 耗 费 。 简 单 地 说 ， 就 是 以 一 条 基本 语句 的 执行 时 间 为 基 
本 单位 ， 该 算法 所 有 语句 中 总 的 基本 语句 的 执行 次 数 就 是 该 算法 的 时 间 耗 费 ， 它 是 该 算法 
所 求解 的 问题 规模 的 函数 。 当 问题 的 规模 趋向 无 穷 大 时 ， 我 们 把 时 间 复 杂 度 的 数量 阶 
称 为 算法 的 渐进 时 间 复 杂 度 ,一 般 我 们 把 渐进 时 间 复 杂 度 称 为 算法 的 时 间 复 杂 度 , 记 作 “O” 
(Order)， 它 有 严格 的 数学 定义 ， 者 T(n) 和 fm) 是 定义 在 正 整 数 集合 上 的 两 个 函数 ， 则 T(n) 
二 O(fn)) 表 示 和 存在 正 的 第 数 C 和 no， 使 得 当 n 之 no 时 都 满足 0TOW 夺 C * fn)。 

评价 或 分 析 一 个 算法 的 时 间 复 杂 度 时 ， 需 要 了 解 算 法 分 析 的 一 些 主要 概念 。 

例 1， 下 列 程 序 。 


for(int I=0:I<n:I++) /x# 执 行 n+l 这 
for(int j=04jJ<n:i++) A# 执 行 ns 人 n+ty 次 
X=X+1]; /* 执 行 n*n 次 


以 每 条 语句 的 执行 次 数 计算 ， 总 的 执行 次 数 是 2n*+2n+1 次 ， 当 n 趋向 无 穷 大 时 ,其 执 
行 次 数 和 ww 是 同一 个 数量 阶 ， 所 以 其 时 间 复 杂 度 记 作 O(n7)。 
例 2; 将 程序 改 为 以 下 格式 。 


for(int I=0;I<1000;I++) A 执行 1001 次 
for(int j=0:j<1000:j++) 执行 1000*1001 次 
x=x+1: /执行 1000*1000 次 


此 时 n 的 值 是 一 个 常数 ， 总 的 执行 次 数 也 是 常数 ， 按 照 O 定义 ， 和 常数 同 阶 ， 所 以 其 
时 间 复 来 度 应 为 0(1)。 
例 3: 在 一 个 有 序 的 数组 中 查找 关键 字 K。 
查找 方法 是 从 中 间 位 置 开 始 比较 ， 该 位 置 记 为 mid， 相对 应 的 数据 元 素 是 Kmid， 比较 
结果 有 3 种 情况 。 
e 天 mid> 开 : KK 如果 存 在 ， 肯 定 处 于 前 半 部 分 。 
e Kmid=K: 查找 成 功 。 
e Kmid<K: KK 如果 存在 ， 肯 定 处 于 后 半 部 分 。 
无 论 (U、(3) 哪 种 情况 ， 都 是 忽略 一 半 ， 缩 小 一 半 范 围 ， 重 复 这 个 过 程 ， 就 能 够 找到 指 
定 的 元 素 ( 或 确定 它 不 在 数组 中 )， 该 过 程 至 多 重复 logz 次 。 
下 面 是 函数 的 过 程 : 
static lnt binary(int K, int[] array, int left, int right) 
《 


/退回 下 在 数组 中 的 下 标 ( 如 果 存 在 )， 否 则 返回 - 1 
int l=left ~ 1 
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int r—right+ 1; Hl 和 + 是 数组 的 上 下 者 

while(l+1!=r) { // 当 1 和 r 相遇 时 退出 循环 

int i=(1+r)/2; // 取 数组 中 的 中 间 值 比较 

if(K<array[i]) r=i; // 如 果 小 于 ， 数 据 如 果 存 在 肯定 在 左 半 部 分 
if(K=——array[il]) return i; // 已 经 找到 

if(K >array[i) 二 ii; //K 可 能 在 数组 的 右 半 部 分 

} 

return -1; // 查 找 不 成 功 


L 


函数 binary 的 功能 是 查找 天 的 (惟一 ) 位 置 ， 并 返回 该 位 置 。 夺 大 不 在 数组 中 ， 则 返回 
一 个 特定 信息 。 还 可 以 对 此 算法 稍 加 改动 , 使 之 能 够 返回 天 在 数组 中 第 一 次 出 现 的 位 置 (者 
数组 元 素 允 许 有 重复 )， 或 者 当 天 不 在 数组 中 时 返回 小 于 天 的 最 大 元 素 的 位 置 。 对 比 顺 序 
检索 和 二 分 法 检索 ， 可 以 看 到 顺序 检索 法 的 平均 和 最 差 情况 代价 O(m) 将 远 远 大 于 二 分 法 的 
代价 O(log2")。 孤 立地 看 ， 二 分 法 比 顺 序 检索 法 效率 高 得 多 。 但 是 ， 注 意 顺 序 检索 法 的 时 
闻 代 价 总 是 相差 不 多 的 ， 无 论 数 组 中 的 元 素 是 否 按照 顺序 保存 。 相 反 ， 二 分 法 检索 要 求 元 
素 必 须 按 从 低 到 高 的 顺序 保存 。 根 据 二 分 法 使 用 的 环境 ， 这 个 排序 的 要 求 可 能 会 对 时 间 代 
价 产生 损害 ， 因 为 要 保持 数组 的 顺序 性 ， 在 插入 新 元 素 时 会 增加 时 间 代 价 。 这 里 有 一 个 权 
衡 的 问题 : 使 用 二 分 法 检索 比较 容易 ， 但 是 维持 一 个 有 序 的 数组 比较 费时 ， 怎 样 权 衡 其 利 
肯 呢 ? 只 有 在 解决 具体 问题 时 才能 知道 是 否 利 大 于 浆 。 

空间 复杂 度 (Space Complexity) 类 似 于 时 间 复 杂 度 ， 是 指 该 算法 所 耗 缆 的 存储 空间 ， 也 
是 问题 规模 的 函数 。 一 般 是 指 渐进 空间 复杂 度 。 记 作 : 


Sn)=ONAn)) 


其 中 n 是 问题 的 规模 (大 小 )。 上 机 执行 的 程序 除 需要 存储 空间 寄存 本 身 所 用 的 指令 、 
常数 、 变 量 和 输入 数据 等 外 ， 一 般 还 需要 数据 进行 操作 的 工作 单元 和 实现 计算 所 需要 的 信 
息 的 辅助 空间 。 如 果 空 间 只 是 取决 于 问题 本 身 ， 与 算法 无 关 ， 则 只 需要 分 析 计 算 所 需要 的 
辅助 空间 ， 否 则 应 考虑 输入 本 身 所 需要 的 空间 。 

例 4: 一 个 包含 个 整数 的 一 维 数组 空间 代价 是 多 少 ? 

如 果 每 个 整数 占有 c 个 字 节 空间 ， 则 整个 数组 占用 cn 个 字 节 空间 ， 其 空间 复杂 度 是 
O(n). 

在 存储 结构 中 ， 例 如 指针 实际 上 是 附加 信息 的 开销 ， 称 为 结构 性 开销 。 从 理论 上 讲 ， 
这 种 结构 性 开销 应 该 尽量 小 ， 而 访问 路 径 又 应 该 尽 可 能 多 且 有 效 。 时 间 空 间 的 权衡 也 正 是 
研究 数据 结构 的 乐趣 所 在 。 

例 5， 信 息 压 缩 和 解压 缩 。 

在 信息 的 压缩 或 者 加 密 过 程 中 ， 节 省 了 存储 空间 ， 但 是 在 信息 的 处 理 过程 中 ， 又 增加 
了 时 间 上 的 开销 。 这 样 得 到 的 程序 空间 代价 小 了 ， 但 时 间 的 代价 却 大 了 。 相 反 ， 许 多 程序 
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也 可 以 预先 存放 部 分 结果 或 者 对 信息 重组 ， 以 达到 提高 运行 速度 的 目的 ， 但 代价 是 占用 了 
较 多 的 存储 空间 。 通 常情 况 下 ， 这 些 时 间 空 间 上 的 变化 都 是 通过 常数 因子 来 改变 的 。 

算法 分 析 时 ， 除 特别 指明 ， 均 是 按照 最 坏 的 情况 分 析 。 我 们 通常 所 说 的 算法 的 复杂 度 
一 般 是 算法 的 时 间 复 杂 度 和 空间 复杂 度 的 合 称 。 

最 好 的 时 间 空 间 改 进来 源 于 好 的 数据 结构 或 算法 ， 所 以 解决 问题 的 步 又 应 该 是 ， 先 调 
整 算 法 ， 后 调整 代码 。 


思考 和 练习 
1. 填空 题 类 
(1) 数据 结构 是 研究 数据 的 和 以 及 它们 之 间 的 相互 关系 ， 并 对 这 
种 结构 定义 相应 的 ， 设 计 出 相应 的 
(2) 数据 结构 通常 是 指 结构 和 结构 两 种 ,通常 是 指 结构 。 


G) 数据 结构 按 结 点 间 的 关系 ， 可 分 为 3 种 逻辑 结构 ， 它 们 分 别 是 、 和 
(4) 选择 合适 的 存储 结构 ， 通 常 考虑 的 指标 有 和 两 个 因素 。 





(5) 数据 结构 的 内 存 存储 方式 主要 有 和 两 种 。 

(6) 线性 结构 反映 结 点 间 的 关系 是 对 的 ， 树 型 结构 反映 结 点 的 关 
系 是 对 的 ， 网 状 关 系 反 映 结 点 的 关系 是 对 的 。 
2. 和 何 答题 类 


(1) 叙述 算法 的 定义 及 其 重要 特性 。 
(2) 分 析 下 列 程序 ， 并 用 O 表示 时 间 的 复杂 度 。 


QD I=1: k=0 
while (I<n) 
{k=k+10*]; 
I++; } 


© for(=1; I<=n; I++) 
for (~=1; j<=]; j++) 
for (k=1; k<=); k++) 


X=Xx+1; 


) I=0; k=0; n=100; 

while (I<=n) 

{k=Kk+ 1O*I: 
I=I+1} 


由 假设 数组 A 元 素 是 从 0 到 nn -1 的 任意 一 个 排列 。 
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Sum=0; 
If (even(n)) 
For(1=0;1<n;Ii++) 
Sum 十 十 ; 
Klse 


Sum=sum+n.; 


(3) 简 述 线性 结构 、 层 次 结构 、 网 状 结构 的 不 同上 后。 

(4) 简 述 算法 复杂 度 评价 方法 。 

(5) 设 有 两 个 算法 在 同一 机 器 上 运行 ， 其 执行 时 间 分 别 为 100n” 和 2 n， 要 使 前 者 快 于 
后 者 ，n 至 少 要 多 大 ? 

(6) 算法 的 时 间 复 杂 度 仪 与 问题 的 规模 相关 吗 ? 

(7) 常用 的 存储 表示 方法 有 哪儿 种 ? 

(8) 从 以 前 用 过 的 程序 中 找 出 一 个 慢 得 无 法 接受 的 程序 ， 找 出 使 程序 速度 慢 的 个 别 操 
作 和 使 程序 执行 得 足够 快 的 其 他 基本 操作 。 

(9) 大 多 数 程 序 设 计 语 育 有 内 建 的 整数 数据 类 型 ， 在 正常 情况 下 这 种 表示 方法 有 固定 
的 长 度 (表示 一 个 整数 所 用 的 位 数 )， 因 此 限制 了 整 型 变量 值 的 大 小 。 给 出 一 种 无 长 度 限 制 
( 除 计 算 机 可 用 内 存 的 限制 之 外 ) 的 整数 表示 方法 ,这样 存储 的 整 型 变量 大 小 就 不 受 限 制 了 。 
试用 这 种 表示 方法 简要 地 说 明 如 何 实现 加 、 乘 、 指 数 操作 。 

(10) 为 字符 串 定义 一 个 ADT, 要 求 包 含 字 符 串 的 典型 操作 ， 每 一 个 操作 定义 为 一 个 函 
数 。 每 一 个 函数 由 它 的 输入 、 输 出 来 定义 。 

(11) 为 一 个 整数 线性 表 定 义 一 个 ADT。 它 包含 线性 表 常 用 的 操作 (一 个 函数 对 应 一 个 
操作 )， 每 一 个 图 数 由 它 的 输入 、 输 出 定义 。 

(12) 为 一 个 整数 集合 定义 一 个 ADT( 注 意 集 合 中 无 重复 元 素 )。 它 包含 整数 集合 的 常见 
运算 ， 每 一 个 运算 对 应 一 个 函数 ， 每 一 个 函数 由 它 的 输入 、 输 出 定义 。 

(13) 为 二 维 整 数 数组 定义 一 个 ADT， 详 细 而 准确 地 说 明 可 以 在 此 数组 上 完成 的 操作 。 
然后 ， 试 看 将 它 用 于 一 个 1 000 行 、1 000 列 的 数组 ， 其 中 非 零 元 素 远 少 于 10 000 个 ， 为 这 
个 数组 设计 两 种 不 同 的 实现 方法 , 使 它们 比 使 用 标准 的 二 维 数组 所 需要 的 100 万 (1 000*1 000) 
个 位 置 的 实现 方法 节省 空间 。 

(14) 每 一 个 问题 都 有 一 个 算法 吗 ? 

(15) 设计 一 个 在 家 用 电脑 上 运行 的 拼写 检查 程序 ， 它 能 够 快速 处 理 少 于 20 页 的 文献 。 
假设 这 个 程序 有 一 个 大 约 20 000 字 的 以 ASCII 码 形式 存储 的 字典 。 这 个 字典 必须 实现 的 原 
语 操 作 是 什么 ?每 一 个 操作 的 合理 时 间 限 制 是 多 少 ? 

(16) 设想 你 被 雇用 去 设计 一 个 包含 美国 城市 和 乡村 信息 的 数据 库 服务 系统 ， 有 成 干 个 
城市 和 乡村 。 此 数据 库 程序 应 当 人 允许 用 户 按 照 名 字 检 索 某 一 个 地 方 的 信息 ， 用 户 根 据 位 置 
或 人 口 等 属性 的 荣 一 个 特定 值 或 茶 一 个 范围 内 的 值 来 查找 满 足 条 件 的 所 有 地 方 。 按 照 用 户 
应 该 看 到 的 操作 ， 摘 述 系 统 的 基本 功能 ， 并 列 出 每 个 操作 的 时 间 限 制 。 

(17) 尽 可 能 地 写 出 你 所 能 想到 的 对 1 000 个 数 进行 排序 的 方法 .其 中 哪 一 种 ( 些 ) 最 好 ? 
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(18) 一 个 图 由 顶点 集合 和 边 集 合 组 成 ， 每 条 边 连接 两 个 顶点 ， 任 意 一 对 顶点 间 只 能 连 
接 一 条 边 。 至 少 给 出 两 种 不 同 的 方法 ， 在 计算 机 中 表示 由 图 的 顶点 和 边 定义 所 确定 的 连接 
关系 ， 你 的 表示 方法 要 能 够 用 来 确定 给 定 的 一 对 顶点 间 是 否 有 边 相连 。 

(19) 假设 有 一 组 记录 ， 按 照 每 个 记录 都 包含 的 一 些 关键 码 字 段 排序 。 给 出 两 种 不 同 的 
方法 检索 有 特定 关键 码 值 的 记录 ， 你 认为 哪 种 更 好 ? 为 什么 ? 

(20) 怎样 比较 两 种 对 一 组 整数 进行 排序 的 算法 ? 特别 地 ， 叫 作为 比较 两 种 排序 算法 的 
基础 ， 用 什么 代价 度量 比较 合适 ? @ 在 这 些 代价 度量 方式 下 ， 用 什么 测试 方法 来 判断 这 两 
种 算法 的 性 能 ?” 

(21) 按照 增长 率 从 低 到 高 的 顺序 排列 以 下 表达 式 ， 


471， logan, 3n， 20”, 2， log>n, nm 


(22) 夯 出 下 列 函 数 图 ， 并 说 出 当 n 取 什么 值 时 ， 每 个 表达 式 的 效率 最 高 。 


4n’ ,logsn, 3n，20"，2,， logon, rn 


(23) 假设 某 一 算法 的 时 间 开 销 为 T(n)=3*2n， 对 于 输入 规模 m， 在 某 台 计算 机 上 实 
现 并 完成 该 算法 的 时 间 为 了 秒 。 现 在 另 有 一 台 计 算 机 ， 运行 速度 为 第 一 台 的 64 倍 ,那么 了 
秒 内 新 机 器 上 能 完成 输入 规模 为 多 大 的 问题 
@ 假设 又 有 一 种 算法 ,-T(m)=m， 其 余 条 件 不 变 ， 那 么 新 机 器 T 秒 内 能 完成 的 输入 规 
模 是 多 少 ? 
(B) 者 算法 T(n)=8n， 其 余 条 件 不 变 ， 那 么 在 新 机 器 上 了 T 秒 内 能 够 处 理 多 少 输入 数据 ? 
(24) 硬件 厂商 XYZ 公 \ 司 宣称 他 们 最 新 研制 的 微 处 理 器 运行 速度 为 其 竞争 对 手 Prunes 
公司 同类 产品 的 100 倍 。 若 Prunes 人 \ 司 的 计算 机 能 在 1 小 时 内 完成 输入 规模 为 n 的 某 程序 ， 
对 算法 增长 率 分 别 为 n、n*、r*、2n 的 程序 ， 分 别 计算 XYZ 公司 的 计算 机 1 小 时 内 能 完成 
的 输入 规模 。 
(25) 根据 O 的 定义 ， 写 出 下 列表 达 式 的 最 好 和 最 二 的 情况 。 
2 oa 
人 csnlog ntesn 
co?" +emm 
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线性 表 是 我 们 日 常 工作 中 最 简单 也 是 最 常用 的 一 种 数据 结构 ， 它 的 最 基本 的 特点 是 每 
个 数据 元 素 最 多 只 能 有 一 个 直接 前 趋 ， 每 个 数据 元 素 最 多 只 能 有 一 个 直接 后 继 ， 只 有 第 一 
个 数据 元 素 没有 直接 前 趋 ， 而 最 后 一 个 数据 元 素 没有 直接 后 继 。 


本 章 的 学 习 目标 : 

线性 表 的 数据 结构 ， 线 性 表 最 显著 的 特点 ; 

线性 表 的 两 种 主要 的 存储 结构 在 存储 时 的 地 址 分 配 ; 

顺序 表 存储 的 数据 元 素 的 地 址 的 计算 和 在 顺序 存储 结构 下 的 基本 运算 
链 式 存储 结构 下 ， 线 性 表 运 算 的 优 缺点 

链 式 存储 结构 的 基本 运算 的 实现 。 


2.1 线性 表 类 型 的 定义 


线性 表 是 最 常用 、 最 简单 的 一 种 数据 结构 ， 简 言 之 ， 线 性 表 是 个 数据 元 素 的 有 限 序 


A=(ai, d2,*"， An) 


其 中 ，4 称 为 线性 表 的 名 称 ， 每 个 ai(n 汪 i 宇 1) 称 为 线性 表 的 数据 元 素 ， 具 体 n 的 值 含义 则 
称 为 线性 表 中 包含 有 数据 元 素 的 个 数 ， 也 称 为 线性 表 的 长 度 ， 当 n 的 值 等 于 0 时， 表示 该 
线性 表 是 空 表 。 每 个 数据 元 素 的 含义 在 不 同情 况 下 各 不 相同 ， 它 们 可 能 是 一 个 字母 、 一 个 数 
字 , 也 可 以 是 一 条 记录 等 。 一 般 情况 下 , 在 线性 表 中 每 个 a; 描 述 的 是 一 组 相同 属性 的 数据 。 

线性 表 的 离散 定义 是 ， B=<4, R>， 其 中 4 包含 nn 个 结 点 (ql, a …… ， 4n)， 怀 中 只 包含 
一 个 关系 ， 即 线性 关系 。R={(ai, al 天 1, 2,， , hn}， 线 性 表 中 包含 的 数据 元 素 个 数 为 线 
性 表 的 长 度 ， : 

一 个 数据 元 素 通常 包含 多 个 数据 项 ， 此 时 每 个 数据 元 素 称 为 记录 ， 含 有 大 量 的 记录 的 
线性 表 称 为 文件 。 

例如 26 个 英文 字母 表 (4, B,……, 刀 是 一 个 线性 表 ， 表 中 的 数据 元 素 是 字母 。 

在 稍微 复杂 的 线性 表 中 ， 一 个 数据 元 素 可 以 由 若干 个 数据 项 组 成 。 

例如 ， 一 个 学 生 的 档案 管理 表 如 图 2-1 所 示 ， 每 个 数据 元 素 相当 于 表 中 的 一 行 ， 包 含 
有 姓名 、 学 号 、 出 生年 月 、 性 别 、 专 业 、 籍 贯 等 6 个 数据 项 。 
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图 2-1 学 生 档案 表 


从 上 例 中 可 以 看 出 每 个 数据 元 素 具 有 相同 的 特性 ， 相 邻 的 数据 元 素 之 间 存 在 着 序 偶 关 
系 ， 即 每 个 数据 元 素 最 多 只 能 有 一 个 直接 前 趋 元 素 ， 每 个 数据 元 素 最 多 只 能 有 一 个 直接 后 
继 元 素 ; 只 有 第 一 个 数据 元 素 没 有 直接 前 趋 元 素 , 而 最 后 一 个 数据 元 素 没 有 直接 后 继 元 素 ， 
线性 表 中 的 数据 元 素 个 数 (学 生 人 数 ) 是 该 线性 表 的 长 度 。 

线性 表 是 一 个 比较 灵活 的 数据 结构 ， 它 的 长 度 根据 需要 增长 或 缩短 ， 也 可 以 对 线性 表 
的 数据 元 素 进 行 不 同 的 操作 (如 访问 数据 元 素 ， 插 入 、 删 除数 据 元 素 等 )。 


一 般 对 线性 表 的 操作 可 以 包含 以 下 几 种 : 
Pubilc linklistQ ”建立 一 个 空 的 线性 表 。 
Pubilc linklist(collection c) 将 collection c 中 的 数据 依次 建立 一 个 线性 表 。 
Pubilc object getfirst( ”返回 线性 表 的 第 一 个 元 素 。 
Pubilc object getlast() 返回 线性 表 的 最 后 一 个 元 素 。 
Pubilc object removefirstD 删除 线性 表 的 第 一 个 元 素 ， 并 将 该 值 返 回 。 
Pubilc object removelastO ”删除 线性 表 的 最 后 一 个 元 素 ， 并 将 该 值 返回 。 
Pubilc void addfirst(object o) 将 object o 插入 在 链表 的 开头 位 置 。 
Pubilc void addlast(object oj) 将 object o 插入 在 链表 的 末尾 位 置 。 


Public boolean contains(object 0) ”检查 object o 是 否 在 链表 中 ， 如 果 存 在 返回 true， 
及 之 返回 false。 


Public int size() 返回 线性 表 的 元 素 个 数 。 


e Public boolean add(object o) 将 object o 插入 到 链表 的 末尾 ， 并 返回 true。 
e Public boolean remove(object 0) 将 object o 在 链表 中 第 一 次 出 现 的 元 素 删除 ,成功 


返回 ttue， 否 则 返回 | false。 


e Public addall(collection c) 将 collection c 中 的 数据 依次 插入 到 链表 的 末尾 。 


Public addall(int index，collection c) 将 collection c 中 的 数据 依次 插入 到 链表 的 
index 位 置 ， 并 将 index 位 置 之 后 的 元 素 依次 插入 在 collection c 之 后 ， 连 接 成 一 个 
完整 的 线性 表 。 

Public void clear() 删除 线性 表 中 的 所 有 元 素 。 

Public object get(int index) ”返回 线性 表 的 index 位 置 的 元 素 。 

Public object set(int index, object element) 以 object element 取代 线性 表 index 位 置 
的 元 素 。 
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e Pubiic void add(int index, object element) 将 object element 插入 到 线性 表 index 位 置 
之 后 。 

e Pubilc object remove(int index) ”删除 线性 表 中 的 index 位 置 的 元 素 。 

e Public int indexoflobject o) 返回 object o 在 线性 表 第 一 次 出 现 的 位 置 ， 若 不 存在 返 


加 - 1。 

e Public int lastindexof(object o ) 返回 object o 在 线性 表 最 后 一 次 出 现 的 位 置 ， 若 不 
存在 返回 - 1。 

ee Public listiterator listiterator(int index ) 返回 线性 表 index 位 置 开 始 的 元 素 内 容 。 

使 用 抽象 数据 类型 (ADT) 和 定义 线性 表 如 下 : 
ADT listf 


数据 对 象 :D={ai | a; 蕊 元 素 集 合 , i=1, 2，…… , mn 过 0} 
数据 关系 :R= {<ai1, a> | ab aiE 元 素 集合 , i=1, 2,，…… ,ny 
基本 操作 : 


{将 以 上 对 线性 表 的 操作 搬 下 来 ， 每 个 函数 注 明 输入 输出 } 此 处 可 以 写 得 详细 一 些 。 
1ADT list 


注意 : 
以 上 只 是 线性 表 的 基本 运算 , 对 于 线 性 表 其 他 的 运算 ， 可 以 通过 基本 运算 的 组 合 来 实现 ， 
例如 将 两 个 或 两 个 以 上 的 线性 表 合 并 成 一 个 线性 表 ， 把 一 个 线性 表 折 分 成 多 个 线性 表 等 。 


2.2 ”线性 表 的 顺序 表示 和 实现 





线性 表 的 存储 结构 分 为 顺序 存储 和 非 顺序 存储 。 其 中 有 顺序 存储 也 称 为 癌 量 行 储 或 一 维 
数组 存储 。 


1. 顺序 表 


线性 玫 的 顺序 存储 ， 也 称 为 向 量 存储 ， 又 可 以 说 是 一 维 数 组 存储 。 线 性 表 中 结 点 存放 
的 物理 顺序 与 逻辑 顺序 完全 一 致 ， 它 叫 癌 量 存 储 (一 般 指 一 维 数 组 存储 )， 与 此 同时 对 应 
4=(al q2,，…, an ) 线 性 表 而 言 ， 线 性 表 的 存储 结构 如 图 2-2 所 示 。 : 


i 


图 2-2 线性 表 的 存储 结构 图 


实际 上 ， 数 据 的 存储 逻辑 位 置 由 数组 的 下 标 决定 。 押 以 家 名 的 元 素 之 问 地 址 的 计算 人 
式 为 (假设 每 个 数据 元 素 占 有 c 个 存储 单元 ): 


LOC(ai)=LOC(a)+ ec 


对 线性 表 的 所 有 数据 元 素 , 假设 已 知 第 一 个 数据 元 素 al 的 地 址 为 d1， 每 个 结 点 占有 c 
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个 存储 单元 ， 则 第 i 个 数据 元 素 @ 的 地 址 为 : 
di=dl+(i - 1)*e 


线性 表 的 第 一 个 数据 元 素 的 位 置 通 常 称 做 起 始 位 置 或 基地 址 。 . 

线性 表 的 这 种 机 内 表示 称 做 线性 表 的 顺序 存储 结构 或 顺序 映像 (Sequential Mapping)， 
使 用 这 种 存储 结构 存储 的 线性 表 义 称 做 顺序 表 。 其 特点 是 ， 表 中 相 邻 的 元 素 之 间 具 有 相 邻 
的 存储 位 置 。 

值得 注意 的 是 ， 在 使 用 一 维 数组 时 ， 数 组 的 下 标 起 始 位 置 根 据 给 定 的 问题 确定 ， 或 者 
根据 实际 的 高 级 语言 的 规定 确定 。 ， 

顺序 分 配 的 线性 表 可 以 直接 使 用 一 维 数 组 描述 为 


type arraylist[]; /type 的 类 型 根据 实际 需要 确定 // 


通常 ， 用 在 数组 的 元 素 个 数 不 是 很 多 且 可 以 对 数组 元 素 “ 枚 举 ” 的 情况 下 ， 也 可 以 使 
用 符合 类 型 数组 的 动态 进行 动态 定义 。 


type arTrayname|j; 


该 代码 只 是 对 应 用 数组 的 声明 ， 还 没有 对 该 数组 分 配 空 间 ， 因 此 不 能 访问 数组 。 只 有 
对 数组 进行 初始 化 并 申请 内 存 资源 后 ， 才 能 够 对 数组 中 元 素 进行 使 用 和 访问 。 


arrayname= new typelarraysize]; 


_ 其 作用 是 给 名 称 为 arrayname 的 数组 分 配 arraysize 个 类 型 为 type 大 小 的 空间 。 其 中 
arraysize 表示 数组 的 长 度 ， 它 可 以 是 整 型 的 常量 和 变量 。 如 果 .arraysize 是 常量 ， 则 分 配 固 
定 大 小 的 空间 ， 如 果 它 是 变量 ， 则 表示 根据 参数 动态 分 配 数 组 的 空间 。 

数组 的 初始 化 也 可 以 使 用 静态 初始 化 ， 也 就 是 在 数组 定义 的 同时 对 数组 元 素 赋值 .例如 : 


int arraynamef]={0,1.2,3,4?; 


人 在 引用 数组 的 元 素 时 ， 和 其 他 高 级 语言 的 用 法 相 则 ， 可 以 直接 使 用 数组 的 下 标 表 示 一 
个 数据 元 素 的 值 和 位 置 ， 例 如 : arraynamef[index]， 其 中 arraynamefindex] 表 示 该 数据 元 素 的 
值 ， 而 index 表示 数组 在 arrayname 中 的 下 标 (位置 )。 下 标的 范围 从 0 开始 一 直到 数组 的 最 
大 长 度 减 1， 数据 类 型 则 可 以 是 整 型 常量 、 变 量 和 表达 式 。 在 Java 中 可 以 直接 使 用 数组 的 
属性 length 获得 数组 的 长 度 。 


2. 顺序 表 基 本 运算 的 实现 


线性 表 顺 序 存 储 的 结构 容易 实现 线性 表 的 某 些 操 作 ， 如 随机 存 取 第 i 个 数据 元 素 等 ， 
但 是 在 插入 或 删除 数据 元 素 时 则 比较 繁琐 ， 所 以 顺序 存储 结构 比较 适合 存 取 数据 元 素 。 
应 该 注意 Java 的 数组 下 标 从 0 开始 。 下 面 考虑 线性 表 顺 序 存储 的 插入 、 删 除 和 排序 的 实 
现 方法 。 
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例 1: 在 线性 表 的 第 i- 1 个 数据 元 素 和 第 i 个 数据 元 素 之 间 插 入 一 个 新 的 数据 元 素 ， 
使 线性 表 的 长 度 增加 一 个 元 素 的 空间 。 

算法 分 析 : 用 顺序 表 作 为 线性 表 的 存储 结构 时 ， 必 须 保 证 数据 存储 的 连续 性 ， 必 须 从 
第 i 个 元 素 到 第 narray.length - 1( 因 为 下 标 从 0 开始 ) 个 元 素 向 后 平移 ， 空 出 一 个 存储 单元 
后 ， 插 入 该 元 素 (如 图 2-3 所 不 》。 


l 1 
2 2 
3 3 
4 4 
插入 27 4 4 
6 6 
7 7 
8 8 
9 9 


je 
人 





图 2-3 ”顺序 存储 插入 前 后 状况 图 


注意 : 


对 数据 元 素 进行 平行 向 后 移 时 ， 遵循 存储 单元 存储 的 后 入 为 主 的 原 则 ， 否 则 将 造成 数 
据 丢 失 、 


对 于 算法 实现 时 ， 主 要 是 一 个 平移 的 过 程 ， 应 该 从 后 向 前 移动 ， 不 应 该 反 向 移动 ， 同 
时 应 该 判断 i 的 取 值 是 否 合理 。 另 外 ,还 应 该 考虑 当前 的 数据 个 数 应 该 最 多 有 narray.length 
- 1 个， 否则 就 要 溢出 了 。 在 程序 段 的 适当 处 应 加 注释 。 下 文 同 ， 不 再 一 一 写 明 。 


Public class arrayinsert z 
{ public static void main(string args[}) 
{ int narray[]; 
if (i>narray.length-1&&i<0) 
ystem.out println(" not exist"”) 
else 
{for (int k=narray.length-1; Kk<=i; k--) 
narray[k+ 1 ]=narray[k] 
narray[i|=item:; 
和 
narray.length=narray.length+1;} 
| 


注意 : : 
插入 结束 后 要 修改 线性 表 的 长 度 。 以 上 算法 的 时 间 主 要 花费 在 结 点 后 移 语句 for 循环 
上 。 该 语句 最 坏 的 情况 下 ， 移 动 次 数 是 narray.length， 最 好 的 情况 下 是 0， 因 为 整个 循环 的 
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次 数 是 narray.length-i+1， 所 以 时 间 不 仅 与 规模 长 度 有 关 ， 而 且 与 插入 的 位 置 有 关 。 其 时 间 
复杂 度 是 O(n)。 


例 2: 顺序 存储 结构 中 ， 删 除 线性 表 的 第 i 个 数据 元 素 ， 使 线性 表 的 长 度 减 少 一 个 元 
素 的 空间 。 作 分 析 的 时 候 可 以 给 出 直观 的 图 来 表示 ， 以 便于 理解 。 

算法 分 析 : 用 顺序 表 作为 线性 表 的 存储 结构 时 ， 必 须 保证 数据 存储 的 连续 性 ， 必 须 从 第 
narray.length - 1( 因 为 下 标 从 0 开始 ) 个 元 素 到 i 个 元 素 向 前 平 黎 ， 直 接 删 除 一 个 数据 元 素 。 

注意 平移 时 ， 遵 循 存储 单元 存储 的 后 入 为 主 的 原则 ， 需 要 从 前 向 后 移动 ， 否 则 将 造成 
数据 丢失 。 

对 于 算法 实现 时 ， 主 要 是 一 个 平移 的 过 程 ， 应 该 从 前 向 后 移动 ， 同 时 应 该 判断 i 的 取 
值 是 否 合理 。 另 外 ， 还 应 该 考虑 当前 的 数据 个 数 是 否 为 0， 否则 就 要 溢出 了 。 


Public class arraydelete 
{ public static void main(string args[]) 
{ Int narrayl[]; 
if (i>narray.length&&1<0) 
system.out.printin(": not exist") 
else 1f (narray.length=——0) 
system.out.printin("overflow") 
ejse 
{for (Int k=1 ; k<narray.length-1; k++) 
narray[k|=narray[k+1] 
} 
narray.length=narray.length-1;} 
和 


例 3: 显示 顺序 存储 的 线性 表 的 所 有 元 素 。 
算法 分 析 : 在 该 例 中 ， 从 下 标 为 0 的 位 置 开 始 打印 ， 线 性 表 的 最 后 一 个 数据 元 素 可 以 
通过 length 获得 ， 只 要 用 循环 语句 实现 即 可 。 只 不 过 需要 判断 当前 线性 表 是 否 为 空 ， 如 果 
为 空 ， 显 示 一 个 特殊 的 符号 即 可 。 
Public void print() 
if (1sempty()) 
system.out.print("(0)"); 
else 
{ 
system.out.print("("); 
for(int 1=0;1<=narray.length-1;i++) 
system.out.print(narray[i]+ " "); 


system.out.print(")"); 
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从 以 上 算法 例 1 和 例 2 可 见 ， 当 在 顺序 存储 结构 的 线性 表 中 某 个 位 置 上 插入 或 删除 一 
个 数据 元 素 时 ， 其 时 间 主 要 耗费 在 移动 元 素 上 ( 换 句 话说 ， 移 动 元 素 的 操作 为 预 估算 法 时 间 
复杂 度 的 基本 操作 )， 而 移动 元 素 的 个 数 取决 于 插入 或 删除 元 素 的 位 置 。 

假设 p 是 在 第 i 个 元 素 之 前 插入 一 个 元 素 的 概率 ， 则 在 长 度 为 ”的 线性 表 中 插入 一 个 
元 素 时 所 需 移动 元 素 的 平均 次 数 为 : 


El=2Zp(n-itl)}) | 


假设 g 是 删除 第 i 个 元 素 的 概率 ， 则 在 长 度 为 n 的 线性 表 中 删除 一 个 元 素 时 所 需 移 动 
元 素 的 平均 次 数 为 ; 


~ E2=Lq(n -i) | 
假定 在 线性 表 的 任何 位 置 上 插入 或 删除 元 素 都 是 等 概率 的 ， 即 : 
p=I/n+1) gqg=l/m; 
则 El 和 E2 可 分 别 简 化 为 以 下 式 子 : 


El=n/2 
EFE2=(n -~ 1)2 


由 以 上 的 式 子 可 见 ， 在 顺序 存储 结构 的 线性 表 中 插入 或 删除 一 个 数据 元 素 ， 平 均 约 移 
动 表 中 一 半 元 素 。 若 表 长 为 nx， 则 插入 和 删除 算法 的 时 间 复 杂 度 为 O(n)。 

由 此 可 以 讨论 在 顺序 存储 结构 下 其 他 基本 运算 的 实现 方法 和 时 间 复 杂 度 。 顺 序 表 的 
“ 求 表 长 ”和 取 第 i 个 数据 元 素 的 时 间 复 洒 度 均 为 0(1), 因为 可 以 直接 求 出 线性 表 的 长 度 ， 
顺序 存储 下 可 以 实现 随机 存 取 ， 可 以 直接 取得 数据 元 素 ， 而 不 需要 移动 元 素 。 


2.3 线性 表 的 链 式 存储 结构 





线性 表 的 顺序 存储 结构 的 特点 是 罗 辑 关系 上 相 邻 的 两 个 元 素 在 物理 位 置 上 也 相 邻 ， 因 
此 随机 存 取 元 素 时 比较 简单 ， 但 是 这 个 特点 也 使 得 在 插入 和 删除 元 素 时 ， 造 成 大 量 的 数据 
元 素 移动 ， 同 时 如 果 使 用 静态 分 配 存储 单元 ， 还 要 预先 占用 连续 的 存储 空间 ， 可 能 造成 空 
间 的 浪费 或 空间 的 溢出 。 如 果 采 用 链 式 存储 ， 就 不 要 求 逻 辑 上 相 邻 的 数据 元 素 在 物理 位 置 
上 也 相 邻 ， 因 此 它 没有 顺序 存储 结构 所 具有 的 缺点 ， 但 同时 也 失去 了 可 随机 存 取 的 优点 。 


2.3.1 音 问 链表 


任意 存储 单元 存储 线性 表 的 数据 元 素 ， 对 于 链 式 存 储 线性 表 时 ， 其 特点 形式 如 图 2-4 
所 示 。 
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2-4 ” 链 式 存储 线性 表 逻 辑 结构 图 


其 中 data 是 数据 域 ,存放 数据 元 素 的 值 ，next 是 指针 域 ， 存 放 相 邻 的 下 一 个 结 点 的 地 
址 ， 单 回 链表 是 指 纸 点 中 的 指针 域 只 有 一 个 治 者 同一 个 方 加 表示 的 链 式 存储 结构 。 
因为 结 点 是 一 个 独立 的 对 象 , 所 以 能 够 实现 独立 的 结 点 类 。 以 下 是 一 个 结 扩 类 的 定义 : 


class link { 
private link next; 
private object data; 
link(object lt , link nextval) 
{ data=it ;next=nextval;} 
link(nextval){next=nextval;} 
link next(}{return next,} 
link setnext(link nextval){return next=nextval;} 
object data(){return data;} 
Object setdata(object it){return data=it; ) 


} 


link 类 比较 简单 ， 其 构造 函数 有 两 种 形式 ， 一 个 函数 有 初始 化 元 素 的 值 ， 而 另 一 个 没 
有 。 其 他 函数 帮助 用 己 访 问 两 个 (私有 ) 数 据 成 员 。 使 用 这 个 类 的 用 户 可 以 取得 并 设置 next 
和 ,data 域 的 值 。 由 于 这 些 设 置 (seb 函 数 可 以 用 来 控制 值 的 改变 ， 只 接受 合理 的 赋值 即 可 。 
link 类 实际 上 是 链表 的 实现 ， 而 不 是 线性 表 类 的 公共 接口 。 

对 于 链 式 分 配 线性 表 ， 整 个 链表 的 存 取 必须 是 从 头 指针 开始 ， 头 指针 指示 链表 中 第 一 
个 结 扩 的 存储 位 置 。 同 时 由 于 最 后 一 个 数据 元 素 ， 没 有 直接 后 继 ， 则 线性 链表 中 最 后 一 个 
结 扣 的 指针 为 “ 空 ”(null)。 

在 使 用 单 链表 结 点 时 ， 必 须 完 成 3 步 (如 图 2-5 所 示 ): 

(1) 创建 一 个 新 结 点 ; 

(2) 为 该 结 点 赋 一 个 新 值 ， 将 当前 元 素 的 next 域 赋 给 新 结 点 的 next 域 ; 

(3) 当前 结 点 的 前 趋 的 next 域 要 指向 新 搬入 的 结 点 。 





图 2-5 单 向 链表 的 插入 图 


如 果 使 用 curr 指针 已 经 指向 当前 元 素 的 前 趋 结 点 ， 以 下 命令 完成 了 以 上 的 3 步 操作 ， 


cur.setnext(new link(it,cur.next(O)); 


运算 符 new 创建 了 链表 的 一 个 新 结 点 , 同时 使 得 新 结 点 的 next 域 指向 当前 结 点 . 而 孙 
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数 eurr.setnextO 则 使 当前 结 点 的 前 趋 结 点 的 next 域 指向 新 插入 的 结 点 ， 完 成 了 新 结 点 的 申 
请 、 插 入 过 程 。 
如 果 可 利用 空间 表 使 用 link 类 实现 ， 申 请 一 个 结 点 的 算法 为 : 


static link freel=null; 
static link get(object it ,link nextval) 
if (freel=——null) 
return new link(it,nextval); 
link temp=freel; 
freel=freel.next(); 
temo.setdata(it); 
temp.setnext(nextval); 
return temp; 


} 


在 使 用 完结 点 后 (一 般 指 被 删除 的 结 点 )， 删 除 过 程 是 将 当前 结 点 的 直接 前 趋 结 点 的 
next 域 指向 被 删除 结 点 的 直接 后 继 结 点 (如 图 2-6 所 示 )。 





[PT ep 


图 2-6 单 同 链表 的 删除 迎 辑 


如 条 curr 表示 当前 结 点 的 直接 前 趋 结 点 ， 对 应 的 删除 命令 是 : 


curr.setnext(curr.next().next()); 


该 命令 设置 curr 结 点 的 next 域 为 当前 结 点 的 的 直接 后 继 。 
释放 被 删除 结 点 的 算法 一 般 为 ; 


vold release() 


{ 
data=null: 
next=freel: 
freel=this; 
} 


删除 结 扣 只 是 将 结 点 从 链表 中 删除 ， 该 结 点 仍然 存在 ， 所 以 不 能 “丢失 ”被 删除 的 结 
氮 的 内 分 ， 需 要 将 结 点 保留 以 便 返 回 给 空闲 存储 器 。 为 便于 将 删除 的 结 点 返回 ， 需 要 将 被 
删除 的 结 点 指针 赋值 给 临时 的 指针 。 

在 可 利用 空间 表 中 ， 可 以 使 用 以 上 的 get 和 release 函数 完成 申请 和 释放 结 点 。 但 是 对 
于 可 利用 空间 表 的 管理 ， 实 际 上 是 对 链表 (假设 可 利用 空间 表 是 以 链表 的 形式 存储 ) 的 插入 
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和 删除 结 扣 的 过 程 。 
调用 link 类 的 get0 形 式 是 : 


curr.setnext(link.getfit,curr.nextO)); /得 到 一 个 结 点 curr 


调用 link 类 的 release0) 形 式 是 : 


link tempptr=curr.next(); 
tempptr.release(0; /释放 tempptr 


2.3.2 单 链表 的 基本 运算 


1. 建立 链表 


假设 给 定 线性 表 中 结 点 的 数据 类 型 是 字符 类 型 , 逐个 输入 这 些 字符 , 每 输入 一 个 字符 ， 
将 该 字符 赋值 给 新 结 点 ， 输 入 字符 时 以 换行 符 为 输入 结束 标志 符 。 

因为 单 问 链表 的 长 度 不 国定， 所 以 应 采用 动态 建立 单 向 链表 的 方法 。 动 态 建立 单 向 链 
表 的 第 用 方法 有 如 下 两 种 。 

(1) 尾 播 入 法 

该 方法 是 将 新 结 点 播 到 当前 链表 的 表 尾 上 ， 为 此 必须 增加 一 个 尾 指 针 tail 的 开销 ， 使 
其 始终 指 回 当 前 链表 的 尾 结 点 ; 或 者 增加 一 个 循环 用 来 查找 链表 的 末尾 结 点 ， 然 后 将 新 结 
扩 插 入 到 链表 的 末尾 。 此 方法 的 优点 是 ， 在 固定 头 head 指针 后 ， 该 指针 就 不 能 再 变 了 。 不 
会 因为 不 断 修改 头 指 针 ， 造 成 头 指 针 的 丢失 。 

实际 上 动态 建立 链表 的 过 程 ， 就 是 不 断 播 入 新 结 点 的 过 程 。 尾 插入 结 点 的 逻辑 图 如 图 
2-7 所 示 。 


| 


图 2-7 插入 结 点 示意 图 


需要 按照 虚线 的 方式 修改 指针 。 

算法 分 析 : 动态 建立 链表 的 步骤 应 该 是 ， 第 一 个 生成 的 结 点 是 开始 结 点 ， 将 开始 结 点 
插入 到 空 表 中 ， 是 在 当前 链表 的 第 一 个 位 置 上 插入 ， 该 位 置 上 的 播 入 操作 和 链表 中 其 他 位 
置 上 的 插入 操作 处 理 是 不 一 样 的 (实际 上 对 其 他 操作 亦 可 能 如 此 )， 因 为 开始 结 点 的 位 置 是 
存放 在 头 指针 head( 指 针 变 量 ) 中 ， 而 其 余 结 点 的 位 置 是 在 其 前 趋 结 点 的 指针 域 next 中 。 因 
此 必须 对 第 一 个 位 置 上 的 插入 操作 做 特殊 处 理 。 其 他 情况 在 else 语句 ， 直 接 插入 即 可 。 

建立 链表 需要 读 入 若干 数据 (假设 数据 存放 在 string namef] 中 ), 若 读 入 的 第 一 个 字符 就 

结束 标志 符 ， 则 链表 head 是 空 表 ， 尾 指针 tail 亦 为 空 ， 结 点 tail 不 存在 ; 个 则 链表 head 
最 后 一 个 尾 结 点 taii 是 终端 结 点 ， 应 将 其 指针 域 置 空 。 
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算法 如 下 : 


class llist implements list 
{ private link head; 
private link tail; 
protected link eurr; 
llist(int sz){setupO);} 
llistO {setupO);} 
private void setup0// 初 始 化 
{ tall=head=curr=new link(null); 
} 
public static void main(string args{]) 
Int dataname=0; 
string dataname; 
whlle (true) 
tdatanarme+ 十 ; 


_ system.out.print( Please input the data name: ”); 


dataname=console.readline(); 
if (dataname.equals(“0”)) 
break: 

newlist.insert(datanname)} 
} 


‘public void clear0) 
《head.setnext(nulh; 


curr=tail=head;// 重 新 初始 化 
} / 
public void insert(object it)// 插 入 一 个 元 素 
{ 
assert.notnull(curr,”no current element’’); 
curr.setnext(new link(it,curr.next())); 
if (taill==curr) 

tail=curr.next(); 

} 

public void append(object it)// 末 尾 添 加 一 个 元 素 

{tail.setnext(new link(it,null)); 


tail=tail.next: /末尾 指针 后 移 


} 


(2) 头 插 入 法 z 
算法 分 析 : 如 果 在 链表 的 开始 结 点 之 前 附加 一 个 结 点， 并 称 它 为 头 结 点 ， 那 么 会 带 来 
以 下 两 个 优点 。 


第 一 


， 由 于 开始 结 点 的 位 置 被 存放 在 头 结 点 的 指针 域 中 ， 
的 操作 就 和 在 表 的 其 他 位 置 上 的 操作 一 致 ， 无 须 进 行 特殊 处 理 。 


所 以 在 链表 的 第 一 个 位 置 上 
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第 二 ,无 论 链表 是 否 为 宅 ， 其 头 指 针 是 指 网 头 结 点 的 非 空 指针 ( 空 表 中 头 结 氮 的 指针 域 
空 )， 因 此 空 表 和 非 空 表 的 处 理 也 就 统一 了 。 在 算法 上 ， 也 就 统一 处 理 了 (如 图 2-8 所 示 )。 


图 2-8 ” 头 插 入 法 逻辑 表示 图 


建立 链表 基本 和 尾 反 入 结 点 方法 类似 。 


public void insert(object it)// 插 入 一 个 元 素 
{ 
assert.notnull(curr,"no current element"), 
curr.setnext(new link(it,head)); 
if (head!=curr) 
head=curr; // 头 指针 前 移 
| 
头 插 入 法 建立 单 同 链表 ， 相 对 尾 插 入 法 建立 链表 ， 不 需要 增加 tail 的 开销 ， 相 对 节省 
空间 ， 但 需要 不 断 修 改 头 指针 。 
2. 查找 运算 
(1) 按 序 与 查找 : 
算法 分 析 : 在 链表 中 ， 即 使 知道 被 访问 结 点 的 序号 六 也 不 能 像 顺 序 表 中 那样 直接 按 
序号 i 访问 结 点 ， 而 只 能 从 链表 的 头 指 针 出 发 ， 顺 着 链 域 next 逐个 结 点 往 下 搜索 ， 直 至 搜 
索 到 第 i 个 结 点 为 止 (一 般 采 用 计数 器 的 方式 )。 链 表 不 是 随机 存 取 结构 ， 只 能 顺序 存 取 。 
查找 之 前 首先 要 做 到 从 头 (head) 开 始 ， 然 后 再 逐个 向 后 查找 ， 查 找 过 程 中 ， 每 向 后 移 
动 一 次 ， 计 数 器 增加 1， 直 到 找到 第 i 个 结 点 (查找 成 功 ) 或 找 完整 个 链表 没有 第 i 个 结 点 ( 查 


找 失 败 )。 


public void nextiO 
{int j=0; 
curr=head.; 
while (QJ!=1)&&(curr!=nu}l)) 
{j++; 
CUIT=Curr.next; 
} 
if (curr==null) 
return (0); 
else 
return j; 
} 
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仅 当 1 科 i 和 mn 为 链表 长 度 ) 时 ,i 值 是 合法 的 。 但 有 时 需要 找 头 结 氮 的 位 置 ， 故 我 们 
把 头 结 点 看 做 是 第 0 个 结 点 ， 我 们 从 头 结 扣 开始 顺 着 链 域 扫描 ， 用 指针 curr 指 网 当前 扫 
描 到 的 结 扣 (原因 是 头 结 反 指针 不 能 变 )， 用 j 作 计数 器 ， 累 计 当 前 扫 拉 的 结 扣 数 ， 直 至 找 
到 i 结 点 。 
curr 的 初 值 指 同 头绪 点 , j 的 急 值 为 0， 当 p 扫 撞 下 一 个 缮 反 时 ,计数器 j 相应 地 加 1。 
当 产 时 ， 指 针 curr 所 指 的 结 扩 就 是 要 找 的 第 i 个 结 丘 。 
在 算法 中 ，while 语句 的 终止 条 件 是 搜索 到 表 尾 或 者 满足 i， 当 搜索 到 表 尾 ，j!=i 时 ， 
表示 i 的 取 值 不 合理 ， 超 出 了 线性 表 的 长 度 范 围 。 
(2) 按 数值 查找 
算法 分 析 : 碍 找 结 点 有 时 可 以 按 数 值 宜 找 ， 按 数值 查找 是 在 链表 中 ， 查 找 是 否 有 结 点 
值 等 于 给 定 值 key 的 结 点 ， 关 有 的 话 ， 则 返回 首次 找到 的 其 值 为 key 的 结 点 的 存储 位 置 ， 
否则 返回 null。 查 找 过 程 从 开始 结 点 出 发 ， 顺 着 链 域 逐个 将 结 点 的 值 和 给 定 值 key 作 比 较 ， 
有 了 两 种 情况 ，curr.val=key( 查 找 成 功 ); 查 到 curr=null 也 没有 出 现 curr.val=key 的 条 件 ( 查 找 
失败 )。 
public vold nextvalO 
{ curr=head; 


while ((curr.vali=key)&&(curr!=null)) 
{ Curr=curr.next; 
} 
if (curr——null) 
return (null); 
else 
return (curr); 


} 


3. 求 链表 长 度 


算法 分 析 : 求 链表 长 度 基本 同 按 序号 查找 ， 从 头 结 点 开始 顺 着 链 域 扫 描 ， 用 指针 curr 
指 癌 当前 扫描 到 的 结 点 (原因 是 头 结 点 指针 不 能 变 )， 用 len 作 计 数 器 ， 累 计 当 前 扫描 的 结 点 
数 ， 直 人 至 curr=null， 返 回 长 度 len 就 可 以 了 。 


public int length() 
{ int len=0; 
curr=head.; 
while (curr!=null) 
{Curr=curr.next; 
lent++; } 
return len， 


和 
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4. 删除 结 点 


算法 分 析 : 删 除 结 点 是 将 表 中 的 某 个 结 点 从 表 中 删除 ， 实 际 上 还 是 利用 查找 算法 ， 找 
到 满足 条 件 的 将 要 删除 的 结 点 后 (注意 删除 过 程 中 , 使 用 的 指针 是 被 删除 结 点 的 直接 前 趋 结 
上 的 指针 ) 直 接 删 除 即 可 。 

删除 结 点 可 按 如 图 2-9 虚线 所 指 修改 指针 。 


Doo bolo TE Eb CIT bE bb A TTT TL TLE EE EDELLTE TT TT EET 


图 2-9 删除 结 点 示意 图 


假设 当前 结 点 已 经 找到 ，curr 表示 当前 结 点 的 直接 前 趋 结 点 。 


public oblect removet() 

{1f (I((curr!=nulD)&&(curr.nextO)!=null)) return null. 
object it=curr.next(O.data(); 

if(tail=—curr.next()) tail=eurr; 

curr.setnext(curr.nextO.nextO) WU 删除 结 点 

return lift， 


} 


5. 打印 链表 的 所 有 元 素 


算法 分 析 : 打印 链表 的 所 有 结 点 的 数值 ， 与 求 链表 的 长 度 的 方法 基本 类 同 ， 只 是 在 找 
到 每 个 结 点 的 后 面 增加 一 条 打印 命令 ， 去 掉 计 数 命令 ， 在 此 方法 中 需要 特别 处 理 的 是 链表 
为 空 时 的 情况 。 


public vold prinO 
{curr=head; 
if (head.next.next()==null) 
system.out.print(“this is a empty list”); 
else 
{while (curr.next!=null) 
{system.out.print(curr.next().data()); 
CUrr—curr.next;} 


二 


从 以 上 的 例子 中 可 以 发 现 ， 在 整个 单 向 链表 的 所 有 操作 中 ， 只 要 做 到 单 向 链表 的 初始 
化 后 , 剩 下 比较 重要 的 算法 是 对 链表 的 插入 、 删 除 和 查询 操作 。 只 要 比较 灵活 地 掌握 插入 、 
删除 和 查询 3 个 基本 的 操作 ， 其 他 大 部 分 操作 可 以 利用 以 上 的 3 种 基本 操作 组 合 实现 。 

值得 注意 的 是 ， 在 单 链表 中 ， 因 为 指针 是 单一 方向 ， 结 点 的 查找 只 能 从 前 向 后 查找 ， 
不 能 反 向 查找 ， 所 以 在 插入 、 删 除 结 点 时 ， 特 别 是 在 某 个 结 点 之 前 插入 ， 或 者 删除 某 个 结 
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点 时 ， 和 需要 利用 结 点 的 前 趋 结 点 的 指针 ， 在 查找 结 点 时 ， 需 要 保留 结 点 的 直接 前 趋 结 点 位 
置 。 也 因为 在 单 链表 中 ， 结 点 的 查找 只 能 从 前 向 后 查找 ， 不 能 反 向 查找 ， 所 以 在 单 向 链表 
中 ， 头 结 点 非常 重要 ， 不 能 丢失 。 


2.3.3 ”循环 链表 


循环 链表 又 称 为 循环 线性 链表 ， 其 存储 结构 基本 同 单 向 链表 。 它 是 在 单 向 链表 的 基础 
上 加 以 改进 形成 的 ， 可 以 解决 单 向 链表 中 单方 向 查找 的 缺点 。 因 为 单 向 链表 只 能 沿 着 一 个 
方向 ， 不 能 反 向 查找 ， 并 且 最 后 一 个 结 点 指针 域 的 值 是 null， 为 解决 单 向 链表 的 缺点 ， 可 
以 利用 末尾 结 点 的 空 指针 完成 前 向 查找 。 将 单 链 表 的 末尾 结 点 的 指针 域 的 null 变 为 指向 第 
一 个 结 点 ， 逻 辑 上 形成 一 个 环 型 ， 该 存储 结构 称 之 为 单 向 循环 链表 。 如 图 2-10 所 示 。 


[| PhLLh>L 


head 


图 2-10 ”循环 链表 的 逻辑 结构 图 


它 相对 单 链表 而 言 , 其 优点 是 在 不 增加 任何 空间 的 情况 下 , 能 够 已 知 任意 结 点 的 地 址 ， 
可 以 找到 链表 中 的 所 有 结 点 ( 环 向 查找 )。 / 
当然 在 查找 某 个 结 点 的 前 趋 结 点 时 ， 需 要 增加 时 间 开 销 完成 ， 查 找 的 时 间 复 杂 度 是 
om。 

循环 线性 链表 中 已 知 链表 中 任何 结 点 ， 可 以 找到 链表 中 的 所 有 结 点 ， 我 们 一 般 还 是 习 
惯 把 头 结 点 作为 已 知 条件 ， 但 是 如 果 已 知 条 件 是 头 结 点 ， 将 在 以 下 的 插入 或 删除 结 点 时 造 
成 不 方便 : 

e 删除 末尾 结 点 

。 在 第 一 个 结 点 前 插入 新 结 点 

在 第 1 种 情况 下 ， 虽 然 能 够 完成 删除 ， 但 是 ， 需 要 我 们 从 头 结 点 开始 逐个 查找 结 点 直 
到 找到 最 后 一 个 结 点 的 直接 前 趋 结 点 ， 然 后 才能 够 删除 ， 整 个 算法 的 时 间 复 杂 度 是 O(n)。 

在 第 2 种 情况 下 ， 虽 然 能 够 完成 插入 ， 但 是 ， 需 要 我 们 从 头 结 点 开始 逐个 查找 结 点 直 
到 找到 最 后 一 个 结 点 ， 然 后 才能 够 插入 ， 因 为 我 们 需要 修改 最 后 一 个 结 点 的 指针 域 ， 整 个 
算法 的 时 间 复 杂 度 是 O(n)。 

以 上 两 种 情况 造成 无 谓 的 时 间 开 销 ， 为 解决 这 个 问题 ， 通 常 在 循环 链表 以 末尾 结 点 指 
针 为 已 知 条 件 ， 这 样 以 上 的 两 种 情况 都 可 以 直接 完成 ， 因 为 已 知 末尾 结 点 可 以 直接 找到 头 
结 点 ， 此 时 的 时 间 复 杂 度 为 0(1)， 这 样 在 不 增加 任何 开销 的 情况 下 ， 减 少 了 时 间 的 开销 。 

空 的 循环 线性 链表 根据 定义 可 以 与 单 向 链表 相同 ， 也 可 以 不 相同 。 判 断 循环 链表 的 末 
尾 结 点 条 件 也 就 不 同 于 单 向 链表 ， 不 同 之 处 在 于 单 向 链表 是 判别 最 后 结 点 的 指针 域 是 否 为 
空 ， 而 循环 线性 链表 末尾 结 点 的 判定 条 件 是 其 指针 域 的 值 指 向 头 结 点 。 
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循环 链表 的 插入 、 删 除 运算 基本 同 单 问 链表 ， 只 是 查找 时 判别 条 件 不 同 而 已 。 但 是 这 
种 循环 链表 实现 各 种 运算 时 的 危险 之 处 在 于 : 链表 没有 明显 的 尾 端 ， 可 能 使 算法 进入 死 循 
环 ， 所 以 判断 条 件 应 该 用 currnextO!=head 替换 单 向 链表 的 currnextO!=null 完成 遍历 所 有 
结 丘 。 : 


2.3.4” 双 链表 


单 循环 链表 中 , 虽然 从 任 一 已 知 结 点 出 发 能 找到 其 直接 前 趋 结 点 , 但 时 间 耗 费 是 O(n)。 

若 希 望 从 表 中 快速 确定 一 个 结 点 的 直接 前 趋 ， 可 以 在 单 链表 的 每 个 结 点 里 再 增加 一 个 指向 

其 直接 前 趋 的 指针 域 prior。 这 样 形成 的 链表 中 有 两 条 方向 不 同 的 链 ， 故 称 之 为 双 ( 向 ) 链 表 。 
双向 链表 形式 描述 为 : 


class DLink{ 
private object element; 
private DLink next: 
private DLink prev; 
DLink(object it,DLink n,DLink p) 
{element =1t next=n; prev=p;} 
DLink(DLink n,DLink p) {next=n; prev=p;} 
DLink next(}) {return next;} z 
DLink setNext(DLink nextval){return next=nextval;} 
DLink prev(}){return prev;} / 
DLink setPrev(DLink prevval) {return prev=prevval;} 
Object elementO|{ return element;} z 

Object setElement(object it){return element=it,} 
}/class Dlink / : 


双向 链表 的 结 点 结构 如 图 2-11 所 示 。 | 


| am | 


图 2-11 双向 链表 的 结 点 结构 图 


其 中 ，element 表示 结 点 的 数值 ，prev 表示 指针 ， 指 向 该 结 点 的 直接 前 趋 结 点 ，next 
表示 指针 ， 指 向 该 结 点 的 直接 后 继 结 点 。 
双 同 链表 的 逻辑 结构 图 如 图 2-12 所 示 。 


head 


图 2-12 双向 链表 逻辑 图 
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双向 链表 的 运算 类 似 单 向 链表 的 运算 ， 主 要 包括 插入 结 点 、 删 除 结 点 、 碍 询 结 扣 等 。 
1. 双 同 链表 的 插入 结 点 


算法 分 析 : 双向 链表 插入 结 点 的 实现 比较 简单 ， 基 本 同 单 向 链表 ， 只 不 过 在 某 个 结 点 
前 或 后 插入 新 的 结 点 时 ， 只 要 找到 该 结 点 就 可 以 了 。 另 外 在 第 一 个 结 点 之 前 插入 时 同 单 向 
链表 插入 结 点 ， 需 要 单独 处 理 。 在 插入 过 程 中 和 单 向 链表 的 主要 不 同 点 是 修改 的 指针 的 个 
数 不 同 。 

。 单 向 链表 修改 两 个 指针 ; 

”。 双向 链表 需要 修改 四 个 指针 。 
在 链表 的 curr 结 点 后 插入 一 个 新 结 点 的 逻辑 图 如 图 2-13 所 示 。 


本 "TT 机 


图 2-13 ”curr 结 扣 后 插入 结 点 远 辑 图 





CUIT 


插入 结 反 应 分 为 以 下 几 个 步骤 ; 

(1) 申请 新 结 护 ， 同 时 给 新 结 点 的 数据 域 、 两 个 指针 域 赋值 ; 
(2) 将 当前 结 点 的 next 域 指 向 新 结 点 ; 

(3) 将 当前 结 扩 的 直接 后 继 的 前 趋 指针 指 同 新 结 点 。 

三 个 步骤 可 以 通过 以 下 的 两 条 语句 实现 : 


curr.setNext(new Link(it,curr.next(),curr)):// 将 当前 结 点 的 next 域 指向 新 结 点 ， 同 时 新 结 点 的 值 为 
it， 而 两 个 指针 域 分 别 是 当前 结 点 和 当前 结 点 的 直接 后 继 结 点 

if(curr.next(}.next(O)}!=null) // 当 前 结 点 的 直接 后 继 不 空 

curr.next().next().setPrev(curr.next());// 修 改 后 继 结 点 的 前 趋 指针 


在 双 同 链表 curr 结 反 的 后 面 插入 一 个 新 结 点 的 算法 (假设 双向 链表 已 经 初始 化 并 且 已 
经 找到 curr 结 所 ): 


//Insert object at current position 
public void insert(object it) 

{ 
Assert.notNull(curr," No current element" ); 
curr.setNext(new DLink(it,curr.nextO,curr)): 
if (curr.next(O .nextO!=nul]) 
Curr.nextO.next().setPrev(curr.next()); 
if(tail==curr) 
taill=taill.next(); 
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如 果 在 双 回 链表 的 末尾 插入 新 结 点 可 以 直接 通过 以 下 函数 实现 ; 


public void append(object it) 
tall.setnext(new Dlink(it,null,tail)); 
tail=tail.next; 


和 


2. 双 问 链表 的 删除 结 点 


算法 分 析 : 双向 链表 删除 结 点 的 实现 基本 同 单 向 链表 ， 只 不 过 在 某 个 结 点 前 或 后 删除 
新 的 结 点 时 ， 只 要 找到 该 结 点 就 可 以 了 ， 不 需要 保留 前 趋 结 点 。 另 外 在 删除 第 一 个 结 点 时 
同 单 向 链表 删除 头 结 点 ， 需 要 单独 处 理 。 在 删除 过 程 中 和 单 向 链表 的 主要 不 同 点 是 修改 的 
指针 的 个 数 不 同 。 

e 单 向 链表 修改 一 个 指针 ; 

e 双向 链表 需要 修改 两 个 指针 。 

在 双向 链表 的 curr 结 点 后 删除 一 个 结 点 的 逻辑 图 如 图 2-14 所 示 。 





删除 双向 链表 的 结 点 步 又 有 : 

(1) 修改 当前 结 点 的 next 域 ; 

(2) 修改 当前 结 点 的 后 继 结 点 和 前 趋 结 点 指针 。 
以 上 两 步 可 以 通过 以 下 的 语句 实现 : 


if (curr.next().next(O!=null) 
curr.next().next().setPrev(curr); 


curr.setnext(curr.next().next(O); 


删除 结 点 算法 为 : 


//remove object 
public vold remove 0O 
{ 
Assert.notfalse(isinlistO,"No current element ); 
Object it=curr.next().elementO): 
if (curr.next().next()!=null) 


curr.next().next().setPrev(curr); 
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else tall=curr; z 
curr.setnext(curr.next().next()); 
return it， 


} 
将 当前 结 点 curr 前 移 的 函数 是 : 


public void prev() 


{ 下 (curri=null) curr=curr.prev();} 


3. 双向 链表 的 查询 结 点 ， 


算法 分 析 : 双向 链表 查询 结 点 的 实现 基本 同 单 向 链表 ， 只 要 按照 next 的 方向 找到 该 结 
点 就 可 以 了 ， 不 需要 保留 前 趋 结 点 。 如 果 找 到 ， 返 回 结 点 位 置 ， 否 则 返回 null。 
查找 结 点 的 步骤 是 ， 从 头 结 点 开始 ， 直 到 找到 该 结 点 或 是 查找 失败 。 
查找 算法 为 : 
public void dlinksearch() 
{ curr=head; 


while ((curr!=null)&&(curr.element()!=key)) 


{curr=curr.next; 


} 
if (curr==null) 
return null. 
else 


return CUIT， 


} 


和 单 链表 类 似 ， 双 链表 一 般 也 是 由 头 指针 head 惟一 确定 的 , 有 时 为 了 处 理 双 向 链表 方 
便 ( 不 需要 特殊 处 理 头 结 点 )， 在 链表 上 增加 一 个 人 为 设置 的 头 结 点 ， 此 结 点 的 值 是 一 个 无 
效 值 ， 有 了 它 能 使 双 链 表 上 的 某 些 运算 变 得 方便 。 

双向 链表 与 单 向 链表 相 比 的 缺点 就 是 使 用 的 空间 更 多 ， 因 为 双向 链表 每 个 结 点 需要 两 
个 指针 的 开销 。 它 需要 的 结构 性 开销 是 单 向 链表 的 两 倍 。 

如 果 将 双向 链表 头 结 点 的 前 趋 指 针 指 向 链表 的 最 后 一 个 结 点 ， 而 末尾 结 点 的 后 继 指针 
指向 第 一 个 结 点 ， 此 时 所 有 的 结 点 链接 起 来 也 构成 循环 链表 ， 称 之 为 双 ( 向 ) 循 环 链表 。 

双向 循环 链表 的 各 种 算法 与 双向 链表 的 算法 大 同 小 异 ， 其 区 别 与 单 链表 和 单 向 循环 链 
表 的 区 别 一 样 ， 就 是 判断 末尾 结 点 的 条 件 不 同 。 双 向 链表 的 末尾 结 点 后 继 指针 域 为 空 ， 而 
双向 循环 链表 的 末尾 结 点 的 后 继 指 针 域 指向 第 一 个 结 点 ， 而 反 向 查找 时 ， 双 向 链表 的 头 结 


点 前 趋 指针 域 为 室 ， 而 双向 循环 链表 的 头 结 点 的 前 趋 指针 域 指 向 最 后 一 个 结 点 。 
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2.4 ”链表 应 用 举例 


例 1: 链 式 存储 下 的 一 元 多 项 式 加 法 。 
在 数学 中 ， 符 号 多 项 式 就 是 形 如 ax 的 项 之 和 。 。 换 旬 话 襄 ， 一 个 一 元 ?次 多 项 式 按 降 
序 排列 ， 可 以 写成 : 


AAX)=anx" + GD + + axt+ ao 


当 an 关 0 时， 称 4,(x) 为 n 阶 多 项 式 。 其 中 a 为 首 项 系数 。 因 此 一 个 n 阶 标准 多 项 式 由 
nt+1 个 系数 惟一 确定 。 在 数据 结构 中 ， 一 个 n 阶 多 项 式 可 以 用 线性 表 表 示 为 : 


A=(a,, Gdn-l, » 1s ao) 

可 以 在 计算 机 内 部 对 4 采用 顺序 存储 结构 ， 使 多 项 式 的 某 些 运算 变 得 更 简洁 。 但 是 ， 
实际 情况 中 的 多 项 式 的 阶 数 可 能 很 高 ， 而 且 不 同 的 多 项 式 阶 数 可 能 相差 很 大 ， 这 使 顺序 存 
储 结 构 的 最 大 长 度 难 以 确定 。 也 就 是 说 ， 若 多 项 式 的 阶 数 很 高 ， 并 且 最 高 次 赛 项 与 最 低 次 
宕 项 之 间 缺 项 很 多 ( 即 系 数 为 零 的 项 很 多 ) 时 ， 如 ， 

ACxX)=x 二 5 
若 采 用 顺序 存储 结构 显然 十 分 浪费 存储 空间 。 因 此 一 般 情况 下 多 采用 链 式 存储 存储 多 项 式 。 


在 用 线性 链表 存储 一 个 多 项 式 时 ， 每 个 系数 非 零 项 对 应 一 个 具有 三 个 域 的 结 点 ， 结 点 
的 结构 如 图 2-15 所 示 。 


coef exp link 
图 2-15 多 项 式 结 点 结构 图 
其 中 ，coef 用 来 表示 存放 某 一 项 的 系数 ， exp 用 来 表示 存放 某 一 项 的 指数 ; link 用 来 表 


示 和 存放 指 岗 该 项 的 下 一 项 所 在 结 点 的 指针 。 
例如 ，S(x) = 6x” - 4x +5 可 以 表示 成 图 2-16 的 形式 。 


ae i 
S 


图 2-16 多 项 式 5 的 链 式 表示 图 


下 面 讨 t 双 链 式 存储 结构 下 多 项 式 的 相 加 运算 ， 拉 述 相 加 运算 时 ， 可 以 作 图 来 说 明 。 
假设 Bn(x) 为 一 元 m 阶 多 项 式 , 则 B(x) 与 4,(%) 的 相 加 运算 Ca)=AAXA) +Bm(x) (Mu n>m) 
用 线性 表 表 示 为 : 


。42 。 数据 结构 与 算法 分 析 (Java 版 ) 


采用 链 式 存储 结构 分 别 表示 为 三 个 一 元 多 项 式 。 其 中 ,4、B、C 分 别 为 指向 各 链表 第 
一 个 结 点 的 指针 。 

算法 分 析 : 一 元 多 项 式 加 法 运算 很 简单 ， 两 个 多 项 式 中 所 有 指数 相同 的 项 对 应 系数 相 
加 ， 若 和 不 为 零 , 则 构成 “和 多 项 式 ” 中 的 一 项 ， 而 所 有 指数 不 相同 的 那些 项 均 复 制 到 “和 
多 项 式 ” 中 。 

算法 中 设置 了 两 个 活动 指针 变量 pa 和 pb， 它们 分 别 沿 着 4 链表 与 B 链表 依次 访问 各 
自 链表 中 的 结 点 。pa 的 初 值 为 4，pb 的 初 值 为 B， 即 分 别 指向 各 自 链表 的 第 一 个 结 点 。 

整个 算法 的 核心 是 ， 比 较 pa 和 pb 所 指 结 点 的 exp 域 的 值 ， 若 相同 ， 则 将 两 结 点 的 系 
数 域 值 相 加 ， 相 加 的 结果 不 为 0， 则 把 这 个 结果 和 相应 指数 分 别 存 入 C 链表 中 新 申请 到 的 
室 结 点 的 系数 域 和 指数 域 ， 若 pa 与 pb 所 指 的 结 点 指数 不 同 ， 先 将 指数 较 高 的 那 一 项 复制 
到 C 链表 中 ， 然 后 将 pa 或 者 pb 移 回 下 一 个 结 点 。 重 复 上 述 步骤 ， 当 pa=null( 或 pb=null) 
时 ， 就 将 B 链表 (或 4 链表 ) 剩 余部 分 复制 到 C 链表 中 ， 直 到 pa、pb 均 为 空 时 算法 结束 。 

将 多 项 式 的 链表 结构 定义 为 : 


class link { 
private link next; 
private object datal; 
private object data2; 
link(object it , object itl,link nextval) 
{ datal=it ;data2=itl ;next=—nextval;} 
link(nextval){next=nextval;} 
link next( )}{return next;} 
link setnext(iink nextval){return next=nextval;} 
object datal(}{return datal;} 
object setdatal(object it) {return datal=it;} 
object data2( ){return data2; } 
object setdata2(object it){return data2=it;} 
和 


根据 以 上 的 定义 ， 假 设 4、B 两 个 一 元 多 项 式 已 经 存在 (可 以 采用 建立 单 向 链表 的 方法 
建立 两 个 单 链表 )。 两 个 多 项 式 的 和 放 在 C 链 表 中 ， 表 中 的 头 结 点 为 head。 
多 项 式 相 加 的 算法 为 : 


private vold setup/) 
{tall=head=curr=new link(null); 
L 
public vold expadd() 
{ link pa=A; 
link pb=B: 
Int x=link pa.next().datal:; 
int y=link pb.next().datal; 
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while ((pa!=null)&&(pb!=null)) 
{ 1f (x<y) 
{link curr.setnext(new Link(pb.next().datal,pb.next().data2,head)); 
head=curr， 
pb=pb.nextO;} 
else 
if (x>y) 
{link curr.setnext(new Link(pa.next().datal,pa.next().data2,head)); 
head=curr， 
pa=pa.next();} 
else 
{int 2=pa.setdata2()+pb.setdata2(); 
if (z!=0) 
{ 
link curr.setnext(new Link(pa.nextO.datal,z,head)); 
head=curr: 
} 
pa=pa.next(); 
pb=pb.next():; 
和 
while (pa!=null) 
{ z 
link curr.setnext(new Link(pa.next().datal ,pa.next().data2,head)); 
head=curr， 
pa=pa.next(); 
} 
while (pb!=null) 
link curr.setnext(new Link(pb.next().datal ,Pb.next().data?2,head)); 
head=curr; 
pb=pb.next(); 
} 
return head; 


和 


例 2: Josephus 问题 。 

Josephus 问题 是 建立 在 历史 学 家 Joseph ben Matthias( 称 为 Josephus) 的 一 个 报告 的 基础 
之 上 ,该 报告 讲述 了 他 和 40 个 士兵 在 公元 67 年 被 罗马 军队 包围 期 间 签 定 的 一 个 自杀 协定 ， 
Josephus 建议 每 个 人 杀 死 他 的 邻居 ， 他 很 聪明 地 使 自己 成 为 这 些 人 中 由 最 后 一 个 ， 因此 获 
得 生还 。 假 设 对 该 问题 使 用 8 个 士兵 时 的 情况 进行 模拟 。 

首先 应 该 定义 存储 结构 ， 假 设 使 用 双向 循环 链表 解决 ， 定 义 一 个 双向 循环 链表 ， 且 为 
Ring 类 ， 是 线性 表 的 一 个 子 类 ， 其 中 Ring 类 的 定义 为 ; 
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public class Ring extends java.util.AbstractSequentialList 
{ Private Node header; 

private int Size = 0; 

public Ring() 


{ 

} 

public Ring(List list) 
{ super(),; 
addall(list); 

L 


public Listlterator listIterator(int index) 

{ return new Ringlterator(index); 

) 

public int size() 

{ return size; 

} 

private static class Node 

{ object object; 

Node previous, next: 

Node(object object, Node previous, Node next) 
{ this.object = object; 

this.previous = previous.; 

this.next = next; 

} 

Node(object object) 

{ this.object = object; 

this.previous = this.next = this; 

} 

} 

private class RinglteratOr implements Listiterator 
{ Private Node next, lastReturned:; 

private int nextIndex; 

Ringlterator(int index) 

{ (ndex<0 | index>size) 

throw new IndexoutOfBoundsException("Index : " + index); 
next=(size==0?7null:header); 

for (nextIndex=0; nextIndex<index: nextIndex++) 
neX = next.next; 

} 

public boolean hasNext( 

{ return Size > 0; 
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public boolean hasPrevious() 
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{ retur Size > 0; 
} 
public object next() 


{ 1f (size==0) throw new NoSuchElementException(); 


lastReturned = next; 
next = next.next: 
nextIndex = (nextIndex==size-1?0:nextIndex+]); 


return LastRetUrmed.object; 

} 

public object Pprevious() 

{ i1f {size==0) throw new NoSuchElementException(); 
next = lastReturned = next.previous; 
nectIndex = (nextIndex==0 ?size-l:nextlIndex-!1); 
return lastReturned.object; 

} 

public int nextindex() 

{ returmn nextIndex; 

} 

public int previousIndex() 

{ retum (nextIndex=—=0 ? slize-l:nextIndex-1); 

} 

public void add(object object) 

{ 1f (size==0) 

{ next= header=new Node(object); 

nextIndex = 0; 

} 

else 

{ Node newNode=new Node(object, next.previous, next); 
newNode.previous.next = next.previous = newNode: 
} 

lastReturned = null; 

十 十 S1Ze， 

nextindex = (nextIndex= 一 Silze-l1 ? 0:nextIndex+1): 
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Publie vold remove() 


{ 1f (lastReturned==null) throw new llliegalStateException(); 


i{f (next==lastReturned) next = lastReturned.next: 
else nextlIndex = (nextIndex=—0 ? size-l:nextIndex-1); 
lastReturned.previous.next = lastReturned.next; 
lastReturned .next.previous = lastReturned .previous; 
lastReturned = null; 

~-S1Ze; 


} 


ed4S 
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public void set(object object) 

{ if (lastReturned==null) throw new TllegalStateException(); 
lastReturned.object = object: 

和 

} 
L 


在 上 述 程序 中 ，Ring 类 是 AbstractSequentialList 类 的 一 个 子 类 ， 它 需要 实现 
listIterator(int) 方 法 和 size0 方 法 。 

算法 分 析 : Josephus 问题 在 已 经 定义 了 Ring 类 后 ， 可 以 简单 考虑 为 一 个 循环 链表 ， 从 
匠 一 点 开始 ， 逐 步 删 除 相 邻 的 结 点 ， 直 到 最 后 剩余 一 个 结 点 为 止 。 


public class joseph 
{ public static vold main(string[] args) 
{Ring ring=new Ring(); 
listiterator it=ring.listiterator(); 
Int N=get("enter number of soldiers"); 
for (int k=0;k<N;k++) 
it.add(new Character((char)( 'A'+k)); 
system.out.print(N + "Soldiers: "); 
system.out.printin(ring); 
while (ring.size(O>1) 
{object killer = it.next(); 
system.out.println(killer + "killed" + it.next()); 
it.remove(); 


} 

system.out.printiIn("the lone survivor is "+ it.next()):; 
} 

Public static int get(String prompt) 

{int n=0; 

try 


{Inputstreamreader reader=new Inputstreamreader(system.in); 
Bufferedreader in=new bufferedreader(reader); 
System.out.print(prompt + ":"); 


String input=in.readline(); 
n= Integer.parseint(input); 
} 

catch(exception ©€) 
{system.out.printin(e);} 
return n; 

| 
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例 3: 使 用 达 代 器 编号 一 个 将 链接 线性 表 逆反 打印 的 算法 。 

实现 线性 表 北 序 的 方法 有 很 多 种 ， 如 果 使 用 迭代 器 逆序 打印 实现 起 来 比较 容易 。 首 先 
迭代 器 是 一 个 对 象 ， 它 能 够 从 集合 中 的 一 个 元 素 移 至 下 一 个 元 素 ， 它 是 数组 或 癌 量 下 标的 
胃 一 个 选择 。 例 如 ， 一 个 双 网 迭代 器 的 定义 为 : 


public nterface Listiterator extends Iterator 
{ public void add(Object object); 
public boolean hasnext(): 
public boolean hasprevious(); 
public Object next(); 
public Int nextindex(); 
public Object previous(); 
public int previousindex(); 
public void remove(); 
public vold set(Object object); 
} 


和 欠 代 器 的 使 用 为 : 


public class diedalqi 

{ public static void main(Stringl} args) 

{String[] planets=new String[]{" Venus","Earth","Mars","Pluto"}: 
List list=Arrays.asList(planets); 
System.out.println("list ="+ list); 

Listlterator it= list.listIterator(); 
System.out.printin("it.next() =" + it.nextO); 
System.out.prImtln( lit.nextO =" + it.next()); 
System.out.printin("it.next() =" + 1t.next()); 
System.out.println("it.nextO =" + it.next()); 
System.out.printin("it.previou() =" + it.previousO)); 
System.out.printin("it.previou() =" + it.previous()); 
} 

} 


使 用 达 代 絮 逆 序 打 印 实 现 为 : 


public static void printforward(LinkedList list) 
{ ListIterator itr=list.listlterator(list.size()): 
while (itr.hasprevious()) 


system.out.println(itr.previous()); 
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2.5 ”顺序 表 和 链表 的 比较 


线性 表 的 存储 有 两 种 :顺序 存储 表 和 和 链 式 存储 表 。 具 体 存 储 方式 可 根据 具体 问题 的 要 
求 和 性 质 来 决定 。 

根据 线性 表 定 长 与 不 定 长 确定 ;顺序 存储 结构 一 般 要 求 数据 存放 的 物理 和 逻辑 地 址 连 
续 ， 而 链 式 存储 结构 数据 存放 地 址 可 连续 可 不 连续 ， 在 线性 表 长 度 没有 确定 的 情况 下 ， 一 
般 采 用 链 式 存储 结构 比较 好 ， 反 之 应 以 顺序 存储 为 主 。 

在 实际 应 用 中 ， 考 虑 何 种 存储 结构 ， 可 以 根据 具体 的 情况 具体 分 析 。 一 般 选 择 存 储 结 
构 时 可 以 主要 从 以 下 两 个 方面 考虑 。 

(1) 基于 空间 的 考虑 / 

顺序 表 的 存储 空间 是 静态 分 配 的 ， 在 程序 执行 之 前 一 般 必须 明确 规定 它 的 存储 规模 。 
车 线性 表 的 长 度 n 变化 较 大 ， 则 存储 规模 难于 预先 确定 (定义 太 大 可 能 浪费 空间 ,定义 太 小 
又 可 能 不 够 用 )。 因 此 ， 当 线性 表 的 长 度 变化 较 大 ， 难 以 估计 其 存储 规模 时 ， 以 采用 动态 链 
表 作 为 存储 结构 为 好 ， 反 之 如 果 存 储 规模 比较 小 ， 并 且 线 性 表 的 长 度 一 般 固 定时 ， 可 使 用 
顺序 存储 。 


仓储 密度 =( 结 点 数据 本 身 所 占 的 存储 量 )/( 结 点 结构 所 占 的 存储 总 量 ) 

一 般 地 ， 和 存储 密度 越 大 ， 存 储 空间 的 利用 率 就 越 高 。 顺 序 表 的 存储 密度 为 1， 而 链表 
的 存储 密度 小 于 1。 由 此 可 知 ， 当 线性 表 的 长 度 变 化 不 大 ， 易 于 事先 确定 其 大 小 时 ， 为 了 
万 约 仓 储 空 间 ， 家 采用 顺序 表 作 为 存储 结构 。 

(2) 基于 时 间 的 考虑 

顺序 表 是 由 癌 量 实现 的 ， 它 是 一 种 随机 存 取 结 构 ， 对 表 中 任 一 结 点 都 可 在 O(1) 时 间 内 
直接 地 存 取 ， 而 链表 中 的 结 点 需 顺序 存 取 ， 应 从 头 指针 起 顺 着 链 指针 扫描 结 点 才能 获得 。 
此 ， 志 对 线性 表 的 操作 主要 是 进行 查找 ， 很 少 做 插入 和 删除 操作 时 ， 采 用 顺序 表 的 存储 
结构 比较 好 。 肥 之， 如 果 在 线性 表 中 需要 做 较 多 的 插入 和 删除 ， 采 用 顺序 存 取 ， 就 可 能 造 
成 大 量 的 数据 移动 ， 在 时 间 上 的 开销 较 大 ， 而 采用 链 式 存储 时 ， 只 需要 修改 相应 的 指针 就 
可 以 了 。 所 以 如 采 比 较 侦 重 线性 表 的 查找 ， 通 常 很 少 对 线性 表 进 行 插入 删除 操作 时 ， 因 为 
顺序 存储 结构 为 随机 存 取 ( 存 取 速 度 快 )， 下 在 铺 纪 析 久 肤 序 全 职 ( 三 取 束 度 相对 较 慢 )， 
此 时 应 采用 顺序 存储 结构 较 好 。 


思考 和 练习 


1. 基础 知识 题 


(1) 在 什么 情况 下 ， 顺 序 表 比 链表 好 ? 
(2) 简 述 线性 表 、 单 链表 、 线 性 表 的 存储 方式 和 双 链 表 、 循 环 链表 的 定义 。 


(3) 描述 以 下 3 个 概念 的 区 别 : 头 指针 、 头 纺 点 (人 为 设置 ) 和 首 元 结 点 (第 一 个 元 素 结 点 )。 
(4) 在 链表 中 人 为 设置 头 结 扣 的 作用 是 什么 ? 
(5) 为 什么 在 单 癌 衢 环 链表 中 设置 尾 指针 比 设置 头 指针 更 好 ? 


(6) 在 顺序 表 中 插入 或 删除 一 个 数据 元 素 , 需要 平均 移动 个 数据 元 素 ， 
移动 数据 元 素 的 个 数 与 有 关 。 z 

(7) 顺序 表 中 到 辑 上 相 邻 的 元 素 的 物理 位 置 为 相 邻 ， 单 链表 中 逻辑 上 
相 邻 的 元 素 的 物理 位 置 为 相 邻 。 


(8) 单 链表 是 由 多 个 结 点 所 串 连 而 成 的 ， 每 一 个 节点 包含 了 和 指向 链表 的 
下 一 个 结 扣 的 指针 。 | 
(9) 使 用 数组 如 何 实现 单 链表 的 指针 表示 ? 
(10) 下 列 哪 一 个 程序 片段 是 在 链表 中 间 播 入 一 个 节点 ? (假设 新 结 点 为 new, 欲 插入 在 
pointer 结 点 之 后 ) 
(a) next[new]=pointer; 
pointer=new; 
(b) next[new]=next[pointer}; 
nexttpointer]=new， 
(c) next[pointer]=next[new]; 
next[new]=polnter; 


(d) 以 上 皆 非 。 


(11) 下 列 哪 一 个 程序 片段 是 删除 链表 中 间 结 点 ? (假设 欲 删 除 结 点 为 pointer 结 点 ,back 
为 前 一 个 结 点 ，-2 表示 未 用 空间 。) 
(a) next[ponter|=-2; 

(b) next[back]=-2; 

(Cj back=next[pointer]}: 
next[pointer]; 

(d) next[back|]=nextipointer]}; 
next[pointer|=-2; 


(12) 如 有 一 个 链表 如 图 2-17 所 示 。 


pointer 1 pointer 2 


图 2-17 


下 列 语句 哪 一 个 是 正确 的 ? 
(a) datafnext[HEAD1]= "A"; 
(b) data[HEAD]= "T"; 
(c) data[pointer 1]]= "A"; 
(d) next[pointer_ 2]=NULL 
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2. 算法 设计 题 


(1) 编写 一 些 Java 语句 , 用 线性 表 建 立 一 个 能 存放 20 个 数据 元 素 而 实际 只 存放 (2, 23， 
5，15，47) 序 列 的 线性 表 。 

(2) 设计 将 一 个 双 疝 循环 链表 逆 置 的 算法 。 

(3) 与 出 在 一 个 头绪 点 的 单 链表 中 的 值 为 x 的 结 点 之 后 插入 m 个 结 点 的 算法 。 

(4) 编写 建立 一 个 单 向 循环 链表 算法 。 

(5) 编写 建立 一 个 双向 循环 链表 算法 。 

(6) 编写 算法 对 无 序 的 线性 表 实 现 有 序 排列 。 

(7) 试 编写 在 不 带头 结 点 的 单 链表 上 实现 线性 表 基 本 运算 LENGTH(L) 的 算法 。 

(8) 假设 有 两 个 按 数据 元 素 值 递增 有 序 排列 的 线性 表 4 和 B, 均 以 单 链表 作 存 储 结构 。 
编写 算法 将 4 表 和 B 表 归 并 成 一 个 按 元 素 值 递减 有 序 ( 即 非 递 增 有 序 ， 允 许 值 相同 ) 排 列 的 
线性 表 。 

(9) 己 知 单 链表 工 中 的 结 上 是 按 值 非 递 减 有 序 排列 的 ， 试 写 一 算法 将 值 为 x 的 结 点 揪 
入 表 工 中 ， 使 得 仍然 有 序 。 

(10) 试 分 列 以 顺序 表 和 和 单 链表 作 存 储 结构 ， 各 写 一 个 实现 线性 表 的 就 地 (即使 用 尽 可 
能 少 的 附加 空间 ) 逆 置 的 算法 ， 在 原 表 的 存储 空间 内 将 线性 表 (cl，az，…… ，an) 逆 置 为 (an， 
Qn-1, ne ,2, Ql1)。 

(11) 假 衣 在 长 度 大 于 1 的 循环 链表 中 ， 无 头 结 点 也 无 头 指 针 。S 为 指向 链表 中 当前 结 
扩 的 指针 ， 试 编写 算法 删除 结 点 的 前 趋 结 点 。 

(12) 已 知 一 单 链表 中 的 数据 元 素 含 有 3 类 字符 ( 即 字母 字符 、 数 字 字 符 和 其 他 字符 )。 
试 编 与 复 法 ， 构 造 3 个 循环 链表 ， 使 每 个 循环 链表 中 只 含 同 一 类 的 字符 ， 且 利用 原 表 中 的 
结 点 空间 作为 这 3 个 表 的 结 点 空间 ( 头 结 点 另 辟 空 间 )。 


3. 应 用 题 


(1) 试 利 用 单 链表 编写 一 个 学 生成 绩 系 统 ， 该 系统 具有 查询 成 绩 、 修 改 成 绩 、 删 除 成 
绩 、 新 增 成 绩 、 全 班 平 均 成 绩 等 功能 。 
数据 如 表 2-1 所 示 。 


表 2-1 学 生成 绩 表 


(2) 用 无 序 线性 表 实 现 一 个 城市 数据 库 。 每 条 数据 库 记 录 包 括 城市 名 (任意 长 的 字符 
串 ) 和 城市 的 坐标 (用 整数 x 和 yy 表示 )。 你 的 数据 库 应 该 允许 插入 记录 、 按 照 名 字 或 者 化 标 
删除 或 检索 记录 ， 还 应 该 支持 打印 在 指定 点 给 定 距 离 内 的 所 有 记录 。: 先 使 用 顺序 表 实 现 ， 
然后 用 链表 实现 。 记 录用 这 两 种 方法 实现 的 每 次 操作 的 运行 时 间 。 这 两 种 实现 方法 的 相对 
优 、 缺 点 是 什么 ?》 如 末 按 照 城市 名 的 字母 顺序 来 存储 记录 ， 使 得 线性 表 成 为 有 序 的 ， 这 样 
能 加 速 一 些 操作 吗 ? 这 种 按照 城市 名 排序 的 线性 表 会 减 慢 一 些 操作 吗 ? 


(3) (Josephus 环 ) 任 意 正 整数 n、k， 按 下 述 方法 可 得 排列 1，2，…… ，n 的 一 个 置换 ; 
将 数字 1，2，…… ,，n 环形 排列 ， 按 顺 时 针 方 向 从 1 开始 计数 ， 计 满 大 时 输出 该 位 置 上 的 


数字 (并 从 环 中 删 去 该 数字 )， 然 后 从 下 一 个 数字 开始 继续 计数 ， 直 到 环 中 所 有 数字 均 被 输 
出 为 止 。 例 如 ， 当 n=10， 三 3 时 ， 输 出 的 置换 是 3，6，9，2，7，1，8，5，10，4 等 。 试 
写 一 算法 ， 对 输入 的 任意 正 整数 xn、 输出 相应 的 置换 。 : 

(4) 利用 单 链表 御 环 结构 编写 多 项 式 相 乘 的 算法 。C=A*B， 不 要 破坏 4、B 表 , 将 C 
表示 成 一 个 新 表 。 

(5) 编号 一 个 通用 的 类 ,用 于 从 一 个 16 位 二 和 进 制 数 中 取出 偶数 位 后生 成 8 位 一 进 制 数 
并 将 其 转换 为 十 进 制 数 。 
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堆栈 和 队列 是 两 种 特殊 的 线性 表 ， 学 习 本 章 的 内 容 主 要 充分 理解 堆栈 和 队列 的 运算 规 
则 。 堆 栈 的 主要 特点 是 只 能 在 栈 顶 操作 ， 也 就 是 遵循 先进 后 出 的 运算 规则 。 队 列 的 主要 特 
点 是 只 能 在 一 端 插入 、 另 一 端 删除 ， 也 就 是 遵循 先进 先 出 的 运算 规则 。 本 章 主要 通过 学 习 
堆栈 和 队列 ， 理 解 队列 和 堆栈 在 实际 中 的 应 用 。 


e 推 栈 定 义 和 摊 栈 的 运算 规则 ， 

堆栈 的 基本 运算 

队列 的 定义 和 运算 规则 ; 

队列 的 基本 和 运算， 特别 是 循环 队列 的 入 出 队 的 运算 。 


3.1 栈 


3.1.1 栈 定义 及 基本 概念 


栈 (Stack) 又 称 堆栈 ， 是 限制 在 表 的 一 问 进 行 插入 和 删除 运算 的 线性 表 。 通 常 称 能 够 进 
行 插入 、 删 除 运算 的 这 一 只 为 栈 顶 (Top)， 邦 一 问 称 为 栈 底 (Bottom)。 当 表 中 没有 元 素 时 称 
为 空 栈 。 

习惯 上 将 每 次 删除 (也 称 为 退 栈 ) 操 作 又 称 为 弹出 (Pop) 操 作 。 删 除 的 元 素 总 是 当前 栈 中 
“最 新 ”的 元 素 ( 栈 顶 元 素 ); 将 每 次 插入 ( 称 为 进 栈 ) 操 作 称 为 压 入 (Push) 操 作 ， 压 入 的 元 素 
总 是 当前 栈 中 “最 新 ”的 元 素 。 

在 空 栈 中 最 先 插 入 的 元 素 总 被 放 在 栈 的 底部 ,只 有 所 有 元 素 被 弹出 之 后 它 才 能 被 删除 。 

当 栈 满 时 进 栈 运算 称 为 “上 游 ”; 当 栈 空 时 退 栈 运算 称 为 “下 溢 ”。 

堆栈 的 存储 结构 有 顺序 存储 结构 和 链 式 存储 结构 两 种 ,在 顺序 存储 结构 下 ,可 以 考虑 堆 
栈 的 上 溢 ， 而 在 链 式 存储 结构 下 ， 不 必 考 虑 堆栈 的 上 溢 现 象 ， 只 需要 考虑 堆栈 的 下 游 现象 。 

堆栈 上 洲 是 一 种 出 错 状态 ， 应 该 设法 避免 它 ， 而 下 洲 则 可 能 是 正常 现象 ， 通 常 下 洲 用 
来 作为 程序 控制 转移 的 条 件 。 

堆栈 的 运算 是 按 后 进 先 出 的 原则 进行 的 (又 称 为 先进 后 出 或 后 进 先 出 )， 简 称 为 
LIFO(last in first out) 表 (所 有 的 运算 只 能 在 栈 顶 运行 如 图 3-1 所 示 )。 就 线性 表 而 言 ， 实 现 栈 
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的 方法 有 很 多 , 我 们 着 重 介绍 顺 序 栈 (arrary-based stack) 和 链 式 栈 (linked stack), 它们 类 似 于 
顺序 表 和 链 式 表 。 


出 栈 入 栈 


栈 顶 


栈 底 
3-1 堆栈 示意 图 


栈 的 基本 运算 一 般 有 以 下 几 种 : 


人 S 


InitStack(S) 构造 一 个 空 栈 5。 

StackEmpty(S) 判 栈 空 ， 关 $ 为 空 栈 返回 TRUE， 否则 返回 FALSE。 

StackFull(S) 判 栈 满 ， 帮 8 为 满 栈 ， 则 返回 TRUE， 和 否则 返回 FALSE。 该 运算 只 
适用 于 栈 的 顺序 存储 结构 。 

Push(S, x) ” 进 栈 。 霹 栈 5 不满， 则 将 元 素 x 压 入 5 的 栈 顶 。 

Pop(S) 退 栈 。 奋 栈 S 非 军 ， 则 将 $ 的 栈 顶 元 素 弹 出 ， 并 返回 该 元 素 。 

StackTop(S) ” 取 堆 栈 的 栈 顶 元 素 ， 不 修改 栈 顶 指针 。 


比较 重要 的 运算 就 是 入 栈 和 出 栈 两 种 。 当 然 每 一 种 运算 对 应 不 同 的 存储 结构 实现 的 方 
法 可 能 有 上 所 不 同 。 
抽象 数据 类 型 定义 堆栈 如 下 : 


ADT Stack{ 
数据 对 象 ;D={ailaiEelementsetj=1,2.3,………n, n 之 0 } 
数据 关系 :R={f<ai-l,ai> | ai-laiED, 约 定 an 端 为 栈 顶 ，al 端 为 栈 底 } 


基本 操作 : 

initstack(s); // 初 始 化 ， 结 果 : 构造 一 个 空 栈 

cleatstack(S)， /清空 堆栈 ; 

stackempty(s); // 判 断 堆栈 是 否 为 空 ; 

stackfull(s); /独断 栈 满 ; 

gettop(s); / 取 栈 项 元 素 ; 

push(s,x); 1// 压 入 堆栈 一 个 元 素 ; 

pop(s); 1 从 栈 顶 弹出 一 个 元 素 ; 

stacklength(s); // 计算 堆栈 中 元 素 的 个 数 ; 
}ADT stack 


根据 堆栈 的 不 同 存储 结构 ， 可 以 实现 对 堆栈 的 不 同 操作 。 堆 栈 是 一 种 特殊 的 线性 表 ， 
所 以 堆栈 的 存储 结构 一 般 也 有 两 种 ， 顺 序 存储 结构 和 链 式 存储 结构 。 
不 入 元 素 称 为 入 栈 , 实际 上 是 在 线性 表 的 头 部 插入 一 个 元 素 ; 弹出 一 个 元 素 称 为 出 栈 ， 
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实际 上 是 在 线性 表 的 头 部 删除 一 个 元 素 。 


3.1.2 顺序 栈 


顺序 栈 的 实现 从 本 质 上 讲 ， 就 是 顺序 线性 表 实 现 的 简化 。 惟 一 重要 的 是 需要 确定 应 该 用 
数组 的 哪 一 端 表示 栈 顶 。 一 种 选择 是 把 数组 的 第 0 个 位 置 作为 栈 顶 。 根 据 线性 表 的 函数 ， 所 
有 的 插入 (insert) 和 删除 (remove) 操 作 都 在 第 0 个 位 置 的 元 素 上 进行 ,由 于 这 时 每 次 push(insert) 
或 者 pop(remove) 操 作 都 需要 把 当前 栈 中 的 所 有 元 素 在 数组 中 移动 一 个 位 置 ， 因 此 效率 不 高 。 
如 果 栈 中 有 n 个 元 素 ， 则 时 间 代 价 为 O(n)。 另 一 种 选择 是 当 栈 中 有 n 个 元 素 时 把 位 置 n - 1 
作为 栈 顶 。 也 就 是 说 ， 当 向 栈 中 压 入 元 素 时 ， 把 它们 添加 到 线性 表 的 表 尾 ， 成 员 函 数 pop 也 
是 删除 表 尾 元 素 。 在 这 种 情况 下 ， 每 次 push 或 者 pop 操作 的 时 间 代 价 仅 为 O(1)。 

堆栈 的 运算 可 以 用 图 的 形式 简单 地 描述 。 

主要 考虑 堆栈 的 入 栈 和 出 栈 算法 。 其 原因 是 在 堆栈 的 基本 运算 中 有 6 种: 判断 堆栈 空 、 
堆栈 初始 化 、 判 断 堆 栈 满 ( 仅 限于 顺序 存储 的 情况 下 )、 入 栈 元 素 、 出 栈 元 素 、 取 栈 顶 元 素 
等 。 而 入 栈 时 需要 考虑 的 操作 步骤 是 堆栈 初始 化 ， 然 后 判断 堆栈 是 否 为 满 ， 如 果 不 满 ， 则 
可 以 插入 元 素 ( 入 栈 )， 出 栈 时 ， 需 要 考虑 的 步骤 是 判断 堆栈 是 否 为 室 ， 如 果 不 空 ， 删 除 元 
系 ( 出 栈 )， 出 栈 之 前 ， 保 存 栈 顶 元 素 。 也 就 是 说 ， 堆 栈 的 入 出 栈 运算 包含 了 其 他 的 6 种 基 
本 运算 ， 取 栈 顶 元 素 的 运算 ， 只 是 不 用 修改 栈 顶 的 指针 而 已 。 

入 栈 操 作 如 图 3-2 所 示 。 

假设 将 4、B、C 依次 压 入 堆栈 形式 如 图 3-3 所 示 ， 数 组 的 容量 为 3。 





图 3-2 ”堆栈 的 初始 状态 图 3-3 ”堆栈 压 入 元 素 的 逻辑 图 
弹出 顺序 依次 如 图 3-4 所 示 。 


TOP=2 





弹出 C 弹出 五 弹出 4 
图 3-4 ”堆栈 弹出 元 素 的 逻辑 图 


从 以 上 的 压 入 和 弹出 结构 可 以 看 出 ， 堆 栈 的 运算 规则 是 先进 后 出 。 在 堆栈 的 运算 中 ， 无 
论 是 何 种 存储 结构 , 只 要 定义 了 堆栈 , 对 它 的 各 种 操作 就 必须 严格 按照 堆栈 的 运算 规则 执行 。 
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根据 先进 后 出 的 原则 ， 顺 序 栈 的 基本 运算 为 : 


Class astack {//array based stack class 
private static final int defaultsize=10; 


private int size; //maxinum size of stack 
private int top; //Index for top object 

private object[] listarray; //Array holding stack objects 
/定义 堆栈 的 空间 大 小 


AStack() {setup(defaultSize);} 
AStack(int sz) {setup(sz);} 
// 堆 栈 初 始 化 
public vold setup(int sz) 
{ size=sz; top=0;listarray=new object[sz];} 
/堆栈 清空 
public void clear() 
{top=0;} 
// 栈 项 压 入 元 素 
public void push(object it) 
{ . 
Assert.notFalse(top<size,'Stack overflow'); 
listarray[top++]=it; 
和 
// 弹 出 栈 顶 元 素 
public object Pop 
Assert.nothalse(lisEmptyO，'empty stack'); 
return listarray[--top]， 
// 取 栈 顶 元 素 值 
public oblect topValue() 
Assert.notFalse(!isempty(),'empty stack )， 
return listarray[top-1]; 
L 
/测试 堆栈 是 否 为 空 
public boolean isempty() 
{ return top==0;} 
}Hclass AStack 


在 此 堆栈 类 中 ,top 值 保留 的 是 一 个 即将 插入 元 素 的 位 置 。 如 果 top 保留 最 后 插入 的 元 
素 的 位 置 ， 初 始 情况 下 ， 堆 栈 的 值 应 是 - 1。 此 时 PUSH 运算 首先 应 将 top 加 1 后 ， 才 能 插 
入 元 素 ， 而 不 是 像 此 例 中 先 放 元 素 再 加 1。 同 样 POP 运算 应 先 保留 元 素 ， 然 后 top - 1， 而 
不 是 像 此 例 中 先 减 1。 
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堆栈 顺序 存储 时 ， 为 避免 上 溢 ， 需 要 首先 分 配 较 大 空间 ， 但 这 容易 造成 大 量 的 空间 浪 
费 。 所 以 当 使 用 两 个 栈 时 ， 可 以 将 两 个 栈 的 栈 底 设 在 向 量 空间 的 两 端 ， 让 两 个 栈 各 自 向 中 
间 靠 拢 ， 使 空间 得 以 共享 。 值 得 注意 的 是 : 此 种 情况 下 ， 虽 然 减少 了 空间 的 浪费 ， 但 同时 
也 增加 了 堆栈 溢出 的 可 能 性 。 因为 每 个 堆栈 的 可 利用 空间 相应 地 减少 了 。 

其 逻辑 图 如 图 3-5 所 示 。 





共享 空间 





图 3-5 ”两 个 堆栈 共享 空间 逻辑 图 


具体 实现 的 方法 是 : 利用 一 个 数组 来 存储 两 个 堆栈 , 每 个 栈 从 各 自 的 端点 向 中 间 延 伸 ， 
这 样 浪 费 的 空间 就 会 减少 。 也 就 是 说 ， 从 一 个 堆栈 取出 元 素 时 ， 栈 顶 指针 是 增加 的 ， 而 另 
一 个 堆栈 的 栈 顶 指针 是 减少 的 ， 反 之 压 入 一 个 元 素 时 ， 一 个 堆栈 的 栈 顶 指针 是 增加 的 ， 而 
另 一 个 堆栈 的 栈 顶 指针 是 减少 的 。 

对 于 多 个 堆栈 的 共享 ， 也 可 以 利用 以 上 的 方法 ， 但 是 当 有 多 个 堆栈 时 ， 可 能 会 出 现 有 
两 个 堆栈 共享 的 空间 已 经 满 了 ， 但 是 其 他 堆栈 可 能 还 有 存储 空间 。 此 时 需要 为 有 空间 的 堆 
栈 为 满 的 堆栈 提供 空间 ， 这 要 造成 大 量 的 数据 移动 ， 虽 然 节 省 了 空间 ， 但 也 增加 了 时 间 的 
开销 ， 这 就 需要 在 实际 应 用 中 ， 衡 量 得 与 失 ， 按 照 实际 需要 来 解决 问题 。 


3.1.3” 链 式 栈 


堆栈 的 链 式 存储 称 为 链 栈 ( 单 向 链表 存储 堆栈 )。 链 式 栈 的 基本 运算 同 顺序 栈 ， 定 义 也 
同 线性 表 的 链表 定义 ， 它 是 对 链表 实现 的 简单 化 (因为 它 只 是 对 链表 的 头 部 操作 )。 它 的 元 
素 只 能 在 表 头 进行 插入 和 删除 。 在 链 式 存 储 结构 中 ， 不 需要 给 出 表 头 结 点 ， 因 为 其 中 惟一 
的 已 知 条 件 是 栈 顶 指针 top， 它 是 指向 链 式 栈 的 第 一 个 结 点 (相当 于 头 结 点 )。 

堆栈 的 各 种 运算 比 链 式 存储 的 普通 线性 表 运算 实现 时 要 方便 得 多 ， 主 要 原因 是 堆栈 的 
各 种 运算 只 能 在 堆栈 的 一 端 操作 。 堆 栈 是 特殊 的 线性 表 ， 我 们 只 要 考虑 对 线性 表 的 一 端 操 
作 的 情况 , 并 且 只 能 在 一 端 插 入 、 删 除 ( 栈 项 ); 而 线性 表 除 此 之 外 (不 限定 一 端 插 入 、 删除)， 
还 需要 考虑 另外 一 端 结 点 以 及 中 间 结 点 的 插入 、 删 除 、 查 询 等 操作 ， 可 以 把 堆栈 的 入 出 堆 
栈 运算 当 作 线性 表 的 一 端 进行 插入 、 删 除 的 特例 。 


注意 : 
推 栈 的 运 划 一 定 遵循 “先进 后 出 ”的 运算 规则 ， 
”对 应 链 式 栈 的 基本 运算 是 : : 


class linkstack { 二 四 
.private link top:; // 栈 顶 指针 
/堆栈 设置 


第 3 章 栈 和 队列 *。57。 


public linkstack(int sz) 
{ setup(); 
4 
/堆栈 初始 化 
private vold setup() 
{top=null;} 
/堆栈 清空 
pubjllie void clear() 
{top=null;} 
/在 堆栈 中 压 入 一 个 元 素 
public void push{(object it) 
top=new link(it,top);} /申请 一 个 新 结 点 ， 数 据 域 的 值 是 it， 同 时， 将 新 结 点 的 指针 域 指向 原 
来 的 top 结 点 ， 新 结 点 的 指针 为 top 
// 在 堆栈 中 弹出 一 个 元 素 


public vold pop() 

{ assert.notfalse(!lisempty(),“*empty stack”);// 堆 栈 是 否 为 空 
object it=top.element(); // 保 留 弹 出 的 元 素 
top=top.next(); // 修 改 栈 顶 指针 
return 1t; 

} 
// 取 栈 顶 元 素 


public object topvalue() 
{ assert.notfalse(!lisempty(),"not top value"); 
return top.element(): 
} 
1/ 测试 堆栈 是 否 为 空 
public boolean isemptyO 
{return top=——=null;) 
} Welass linkstack 


其 中 push 首先 修改 新 产生 的 链表 结 点 的 next 域 并 指向 栈 顶 , 然后 设置 top 指向 新 的 链 
表 结 点 ; 而 pop 中 则 是 用 it 保存 栈 顶 值 ，top 指向 当前 栈 顶 链接 到 的 下 一 个 结 点 ，it 的 值 
作为 pop 的 返回 值 。 

值得 注意 的 是 :因为 堆栈 只 能 在 头 部 ( 栈 顶 ) 操 作 ， 所 以 链 式 存储 堆栈 时 不 能 附加 表 头 


3.1.4 ”顺序 栈 和 链 式 栈 的 比较 


实现 链 式 栈 和 顺序 栈 的 操作 都 是 需要 常数 时 间 ， 即 时 间 复 杂 度 为 0(1)， 主 要 从 空间 和 
时 间 两 个 方面 考虑 。 
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初始 时 ,顺序 堆栈 必须 说 明 一 个 固定 的 长 度 ， 当 堆栈 不 够 满 时 ,造成 一 些 空间 的 浪费 ， 
而 链 式 堆栈 的 长 度 可 变 则 使 长 度 不 需要 预先 设 定 ， 相 对 比较 节省 空间 ， 但 是 在 每 个 结 点 中 
设置 了 一 个 指针 域 ， 从 而 产生 了 结构 开销 。 

当 需 要 多 个 堆栈 共享 时 ， 顺 序 存储 中 可 以 充分 利用 顺序 栈 的 单 向 延伸 性 。 可 以 使 用 一 
个 数组 存储 两 个 堆栈 ， 使 每 个 堆栈 从 各 自 的 端点 向 中 间 延 伸 ， 这 样 浪费 的 空间 就 会 减少 。 
但 只 有 当 两 个 堆栈 的 空间 有 相反 的 需求 时 ， 这 种 方法 才 有 效 。 也 就 是 说 ， 最 好 一 个 堆栈 增 
长 ， 一 个 堆栈 缩短 。 反 之 ， 如 果 两 个 堆栈 同时 增长 ， 则 可 能 比较 容易 井 成 堆栈 的 洲 出 。 如 
果 多 个 顺序 堆栈 共享 空间 ， 且 一 个 共享 的 堆栈 满 了 ， 此 时 可 能 其 他 的 堆栈 没有 满 ， 则 需要 
按照 堆栈 的 运算 规则 (LIFO)， 将 满 栈 的 元 素 问 右 或 左 平 黎 ， 这 就 可 能 造成 大 量 的 数据 元 素 
移动 ， 使 得 时 间 的 开销 增 大 。 相 对 而 语 ， 使 用 两 个 堆栈 共有 至 一 个 空间 是 比较 适宜 的 存储 方 
法 ， 但 同时 也 增加 了 堆栈 溢出 的 可 能 性 。 链 式 堆 栈 由 于 存储 的 不 连续 性 ， 什 么 时 候 需 要 空 
间 ， 什 么 时 候 束 可 以 申请 ， 一 般 不 存在 堆栈 满 的 问题 ， 但 是 链 式 存储 的 堆栈 在 存储 时 ， 需 
要 增加 指针 开销 ， 从 总 体 而 言 ， 比 较 浪 费 空间 ， 好 处 是 一 般 不 需要 栈 的 共享 。 


3.1.5” 栈 的 应 用 举例 


实际 生活 中 先进 后 出 的 实例 比较 多 ， 例 如 儿 辆 火车 进入 同一 个 铁轨 ， 出 来 时 必须 遵循 
先进 后 出 ;计算 机 使 用 中 断 时 ， 保 护 现 场 使 用 堆栈 ， 中 断 返 回 时 从 堆栈 中 弹出 (恢复 现场 )， 
也 是 遵 御 先 进 后 出 原则 ;数学 中 求 阶乘 时 ， 可 以 使 用 堆栈 保存 以 前 的 数据 ， 直 到 0 的 阶乘 
为 止 等 。 堆 栈 的 应 用 例子 比较 多 ， 但 比较 典型 的 是 数 制 的 转换 、 表 达 式 的 计算 、 转 换 问 题 
和 递归 问题 。 

1. 数 制 的 转换 


在 十 进 制 数 入 和 4 进 制 数 的 转换 是 计算 机 实现 计算 的 基本 问题 ， 解 决 的 方法 有 很 多 ， 
但 其 中 的 基本 原理 是 : N mod 4 的 值 是 余数 ,余数 作为 转化 后 的 值 ， 用 N div 4 的 商 再 作为 
N 的 值 ， 册 求 余 数 ， 依 此 类 推 ， 直 到 商 数 为 零 。 最 后 将 所 得 的 余数 反 向 输出 ， 就 是 我 们 需 
要 的 结果 。 由 此 看 出 ， 先 得 到 的 结果 最 后 输出 ， 而 最 后 得 到 的 结果 第 一 个 输出 ， 恰 好 满足 
堆栈 的 运算 规则 : 先进 后 出 。 所 以 ， 可 以 使 用 堆栈 实现 数 制 的 转换 。 


Import Java.1o0.*; 

Public class transportnum 

{ public static void main(string args[]) 

{ Inputstreamreader inputreader; 
bufferreader butfreader: 
inputreader = new Inputstreamtreader(system.ln); 
bufreader = new bufferreader(inputreader); 
tempstr= bufreader.readline(); 
int n = Integer.parseint(tempstr); 


int nl1=0; 
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while (n!=0) /只 要 商 没有 等 于 0 
{nl=n%d:; /所 求 的 余数 
n=n/d; mn 中 存放 除 以 d 的 余数 


top=new link(nl,top);} /申请 一 个 新 结 点 ， 数 据 域 的 值 是 n1， 同 时 ， 将 新 结 点 的 指针 域 指向 
原来 的 top 结 点 ， 新 结 点 的 指针 为 top 
while (isemptyO) // 堆 栈 不 空 
system.out.print(top.element);。 /输出 元 素 


2. 表达 式 的 转换 


表达 式 一 般 有 中 缀 表达 式 、 后 缀 表达 式 和 前 缀 表达 式 3 种 表示 形式 ， 通 常 我 们 使 用 中 
级 表示 ,但 是 中 组 表达 式 在 计算 机 中 存储 计算 时 ， 比 较 麻烦 ， 所 以 计算 机 内 存储 表达 式 时 ， 
一 般 采 用 后 缀 或 前 绷 表 示 较 多 。 

一 个 表达 式 通常 由 操作 数 、 运 算 符 及 分 隔 符 所 构成 。 一 般 我 们 习惯 使 用 中 组 描述 法 ， 
也 就 是 将 运算 符 放 在 操作 数 中 间 ， 例 如 ; 


atph*e 
由 于 运算 符 有 优先 级 ， 所 以 在 计算 机 内 部 使 用 中 缀 描述 是 非常 不 方便 的 ， 特 别 是 带 有 
括号 时 更 麻烦 。 为 方便 处 理 起 见 ， 一 般 需 要 将 中 缀 的 表达 式 利用 堆栈 转换 成 为 计算 机 比较 


容易 识别 (没有 括号 ) 的 前 缀 或 后 缀 表达 式 ， 这 样 在 扫描 表达 式 时 ， 只 要 按照 运算 符 直 接 计 
算 即 可 。 例 如 ; 


ta*bc 前 级 表达 式 


abc*+ 后 缀 表达 式 


其 转换 的 过 程 按照 优先 级 转换 ， 运 算 符 的 优先 级 如 表 3-1 所 示 。 


表 3-1 运算 符 优先 级 顺序 表 


优 先 级 运 算 符 
高 插 写 ; “( ) 
| 负 号 ，“ - ， 
乘 号 ，“*”， 除 号 ， “/” ， 余 数 ， “9%” 
加 号 ，“+”， 减 号 “ 
低 


下 血 以 中 缀 表达 式 a/(b - c) 为 例 说 明 中 缀 表达 式 转换 为 前 级 表达 式 的 具体 步骤 ( 先 处 理 
优先 级 高 的 式 子 )。 
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步骤 1: 先 处 理 优先 级 最 高 的 ， 括 写 内 将 (b - c) 转 换 为 ( - pc)。 

步骤 2:， 将 除 号 进行 处 理 为 /a， 整 个 表达 式 为 /ak - pc)。 

步骤 3: 消除 括号 为 /a - gc， 就 是 将 中 缀 变 为 的 前 缀 表达 式 。 

计算 机 处 理 中 缀 表达 式 时 ， 假 设 按照 从 左 向 右 的 扫描 顺序 ， 依 次 存放 表达 式 的 各 个 符 
号 ， 在 扫 拉 过程 中 ， 可 以 一 边 输 入 ， 一 边 计 算 。 但 是 因为 中 缀 表达 式 中 操作 符 的 优先 级 的 
限制 ， 对 新 输入 的 运算 符 的 优先 级 需要 进行 比较 ， 然 后 才能 够 计算 ， 所 以 必须 使 用 堆栈 保 
存 以 前 的 数据 和 运算 符 。 

利用 堆栈 处 理 中 缀 表达 式 的 步骤 是 ; 

(1) 设置 两 个 堆栈 ， 一 个 操作 数 堆栈 和 一 个 运算 符 堆栈 。 

(2) 急 始 时 为 衬 ， 读 取 表 达 式 时 ， 只 要 读 到 操作 数 ， 将 操作 数 压 入 操作 数 栈 。 

(3) 当 读 到 运算 和 从 时 将 新 运算 符 和 栈 顶 运算 符 的 优先 级 比较 ， 如 果 新 运算 符 的 优先 级 
高 于 栈 顶 运算 符 的 优先 级 ， 将 新 运算 符 压 入 运算 符 堆栈 ， 否 则 取出 栈 顶 的 运算 符 ， 同 时 取 
出 操作 数 堆 栈 中 的 两 个 操作 数 进行 计算 ， 计 算 结 果 压 入 操作 数 堆 栈 。 

(4) 重复 (2)、(3) 步 又， 直到 整个 表达 式 计 算 结 束 为 止 ， 此 时 操作 数 扒 栈 中 的 结果 就 是 
表达 式 的 计算 结果 。 

例如 ; 4+B/C-D。 

步骤 1: 设置 两 个 堆栈 ， 如 图 3-6 所 示 。 

步骤 2: 压 入 4 到 操作 数 堆栈 ， 如 图 3-7 所 示 。 


操作 数 栈 运算 符 栈 操作 数 堆栈 运算 符 堆栈 
图 3-6 堆栈 的 初 态 3-7 ”扫描 “A” 时 堆栈 的 状态 


步骤 3: 将 “+” 压 入 运算 符 堆栈 ,将 B 压 入 操作 数 堆 栈 ， 如 图 3-8 所 示 。 
步骤 4: 当 读 到 “/” 时 ， 运 算 符 比 较 优 先 级 。“/” 优 先 级 高 于 栈 顶 “+” 的 优先 级 ， 
所 以 将 “/” 压 入 运算 符 堆栈 ， 如 图 3-9 所 示 。 z 


a 四 a 
yy 和 “+B” 时 堆栈 的 状态 图 3-9 扫描 “/” 时 堆栈 状态 


步骤 5; 读 到 C， 将 C 压 入 操作 数 堆栈 ， 读 到 “- ”时 ， 将 “ - ”优先 级 和 栈 顶 “/” 
的 优先 级 比较 ， 小 于 “/” 优 先 级 ， 先 弹出 “/”， 再 从 操作 数 堆栈 中 弹出 两 个 操作 数 ， 计 
算 后 结果 压 回 操作 数 堆栈 , 然后 将 “- ” 压 入 运算 符 堆栈 , 读 到 D, 将 D 压 入 操作 数 堆栈 ， 
如 图 3-10 所 示 。 

步骤 6: 取出 “- ”和 两 个 操作 数 ， 计 算 “ - ”， 结 果 压 入 操作 数 堆栈 ， 如 图 3-11 
所 示 。 
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D 
B/C BAC - D 
A 


操作 数 堆栈 | 操作 数 堆栈 。 ”运算 符 堆 械 
图 3-10 扫描 “C-D” 时 堆栈 的 状态 。 图 3-11 扫描 结 束 后 计算 “ - ”时 堆栈 状态 图 


步骤 7: 取出 “+” 和 两 个 操作 数 ， 结 果 压 入 操作 数 栈 ， 计 算 结 束 ， 如 图 3-12 所 示 。 


操作 数 堆栈 运算 符 堆 栈 
图 3-12 最 后 堆栈 的 状态 


由 以 上 的 步骤 可 以 看 出 ， 中 绥 表 达 式 的 计算 需要 使 用 两 个 堆栈 ， 并 且 计 算 比 较 繁 琐 。 
而 后 弘 ( 或 前 缀 ) 表 达 式 的 计算 只 需要 一 个 堆栈 ， 建 立 一 个 操作 数 堆 栈 ， 将 表达 式 从 左 向 右 
扫描 ， 只 要 是 操作 数 ， 压 入 操作 数 堆栈 ;， 只 要 是 运算 符 ， 从 栈 中 取出 元 素 计算 ， 计 算 结 果 
存 入 操作 数 堆栈 ， 直 到 扫描 表达 式 结束 为 止 。 由 此 可 见 ， 后 缀 表达 式 的 处 理 比 中 缀 表达 式 
的 处 理 简 单 的 多 。 

值得 注意 的 是 ， 我 们 日 常生 活 中 习惯 使 用 中 缀 表达 式 ， 而 计算 机 使 用 后 绕 或 前 织 处 理 
比较 方便 , 所 以 对 表达 式 的 计算 , 就 需要 预先 处 理 一 下 , 最 好 是 将 中 缀 表达 式 转 换 为 后 缀 (前 
缀 ) 表 达 式 。 这 就 是 我 们 考虑 的 关键 问题 ， 如 何 将 中 缀 表达 式 转 换 为 后 缀 (前 缀 ) 表 达 式 。 在 
中 级 变 后 缀 时 ， 操 作 数 的 顺序 不 会 发 生变 化 ， 只 有 运算 符 的 顺序 可 能 发 生变 化 ， 同 时 又 没 
有 括号 ， 所 以 在 转换 的 过 程 中 ， 只 要 碰 到 操作 数 ， 可 以 直接 和 输出， 而 碰 到 运算 符 和 括号 进 
行 相 应 的 处 理 即 可 。 

转换 原则 如 下 : 

(1) 从 左 至 右 读 取 一 个 中 序 表达 式 。 

(2) 若 读 取 的 是 操作 数 ， 则 直接 输出 。 

(3) 耕读 取 的 是 运算 从 ， 分 3 种 情况 。 

e 该 运算 从 为 左 括 号 “(”， 则 直接 存 入 堆栈 。 / | 

e 该 运算 符 为 右 括 号 “)”， 则 输出 堆栈 中 的 运算 符 ， 直 到 取出 左 括号 为 止 。 

e 该 运算 符 为 非 括 号 运算 符 ， 则 与 堆栈 顶端 的 运算 符 做 优先 权 比 较 ， 若 较 堆栈 顶端 运 

算 符 高 或 相等 , 则 直接 存 入 堆栈 ; 车 较 堆栈 顶端 运算 符 低 ， 则 输出 堆栈 中 的 运算 符 。 

(4) 当 表 达 式 已 经 读 取 完 成 ， 而 堆栈 中 尚 有 运算 符 时 ， 则 依次 序 取出 运算 符 ， 直 到 堆 
栈 为 空 ， 由 此 得 到 的 结果 就 是 中 组 表达 式 转 换 成 的 后 缀 表达 式 。 

假 仅 栈 项 元 素 的 运算 符 是 9 ， 新 读 到 的 运算 符 是 6， 表达 式 的 终 得 是 并， 以 “>?” 

“<” 表 示 优 先 级 的 高 与 低 。 运 算 符 优 先 级 如 表 3-2 所 示 。 ” 
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表 3-2 运算 符 优先 级 关系 表 


Ee 

0 
- > 
一 > 
x > 
<| || 
>| >| > >»>| | >| > 
4 <| <| | -| -| |- 


根据 此 优先 关系 表 和 转换 规则 ， 可 以 实现 将 中 缀 表达 式 转换 为 后 缀 表达 式 ， 从 而 被 计 
算 机 所 接受 。 

例如 : A/B - C*(D+E)。 

(1) 输出 4，“/” 入 栈 ; 

(2) 输出 B; 

(3) 读 到 “- ”时 ， 将 “- ”优先 级 和 栈 中 的 “/” 优 先 级 比较 ， 小 于 ， 则 输出 “/”， 
然后 将 “ - ”入 栈 ; 

(4) 输出 C， 将 “*” 优 先 级 和 “ - ”比较 ， 大 于 ， 将 “*” 入 栈 ; 

(5) 将 “(” 入 栈 ， 输 出 刀 ， 将 “+” 入 栈 ， 输 出 E; 

(6) 读 到 “)” 时 ， 输 出 “+”， 一 直到 “(” 出 栈 ; 

(7) 输出 “*”， 输 出 “~ ”， 堆 栈 为 空 结束 。 

输出 的 结果 4B/CDE+*- 就 是 转换 完成 的 后 缀 表达 式 。 


其 转换 算法 为 : 
class Stackapp 
{ 
public static void main (String args[]) 
( 
StackArray Operator=new Stackarray();  /W/ 运 算 符 堆 栈 
String inorder=new String(); “”W 声 明 前 序 表达 式 字 符 审 
Int inposition=0; /前 序 表达 式 位 置 


Int Operatorl=0; /运算 符 

System.out.print("Please input the inorder expression: "); 
// 读 取 前 序 表达 式 存 入 字符 串 

ConsoleReader console=new ConsoleReader(System.in): 
Inorder=console.readline(); 


System.out.print(" The postorder expression is["]; 
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While {true) 

{ 

/判断 是 否 为 运算 符 

lf (Operator.Isoperator(inorder.charat(inposition))) 
‘ 

if (operator.top==-] ||(char)inorder.charat(inposition)=—="(") 
// 将 运算 符 存 到 堆栈 中 
operator.push(inorder.charat(inposition)); 

else 

{ 

if((char)inorder.charat(inposition)==")') 

{ 

// 取 出 运算 符 直到 取出 "( 
if(operator.astack[operator.top]!=40) 

t 

operator1=operator.pPopO; 
9%ystem.out.print((char)operator1 ); 


和 


if (operator.priority(inorder.charat(inposition)) 
operator.priority(operator.astack[operator.top])!=-1) 
operatorl~=operator.pop(); 
if(operatorl!=40) 
System.out.print((char)operator] ); 
operator.push(inorder.charat(inposition)); 
system.out.print(inorder.charat(inposition)); 
1f(iInposition)>=inorder.length()) 
while(operator.top!=-1) /取出 在 堆栈 中 所 有 的 运算 符 
operatorl=operator.pop(); 
system.out.print((char)}operator] ); 
System.out.printin(")"); 
int [] astack=new int [maxsize]; 

1/ 存 入 堆栈 数据 
publie vold push(int value) / 
if (top>=maxsize) /判断 是 否 已 超出 堆栈 最 大 容量 
system.out.println("The stack is full!"); 


topt+t,; 

astack[top]=value; 。// 栈 顶 指针 加 1， 压 入 堆栈 
// 从 堆栈 中 取出 数据 : | 

public int Pop() 


{ int temp; : 
if (Top<0) /判断 堆栈 是 否 为 空 
system.out.printin("The stack is empty!"); 
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return 一 ] ; 
} 
temp=astack[top], // 将 取出 数据 暂 存 于 变量 中 
top--; // 栈 预 指针 -1 
return temp:; 
} 
// 判 断 是 否 为 运算 符 
public boolean isoperator(int operator) 
{ 
if(operator==43 | operator==45 
loperator==42 | operator 一 47 
loperator==40 || operator=—41) 
return true; /+-*/ 运 算 符 
else 
return 人 false; 

/判断 运算 符 的 优先 权 

public int priority(int operator) 
{ 
//+-( 运 算 和 从 
tt (operator==43 |loperator==45 || operator==40) 
return 1; 
else i 廊 operator==42 || operator==47) ”//*/ 运 算 符 
return 2;: 
else 
return 0:; 

和 

} 


按照 以 上 的 算法 ， 可 以 在 计算 机 内 首先 完成 表达 式 的 转换 ， 然 后 再 计算 表达 式 的 值 ， 
这 样 计算 机 在 计算 时 相对 比较 节省 系统 资源 。 
3. 递归 


递归 问题 实际 上 是 程序 或 函数 重复 调用 自己 ， 并 传 入 不 同 的 变量 来 执行 一 种 程序 。 辟 
如 一 个 人 上 楼 梯 , 他 现在 在 底层 ,如果 想 登 上 100 层 台阶 , 可 以 用 一 种 方法 : 如 果 想 上 100 
层 ， 只 要 登 上 99 层 , 再 上 一 层 即 可 ;如果 想 上 99 层 ， 只 要 登 上 98 层 ， 依 次 类 推 ， 如 果 想 
上 2 层 ， 只 要 登 上 1 层 ， 登 上 1 层 的 方法 可 以 直接 实现 。 解 决 这 个 问题 ， 只 要 处 理 1 层 的 
问题 ， 其 他 的 层次 只 要 调用 自己 的 同时 ， 层 数 (参数 ) 不 断 减 少 即 可 。 在 编写 递归 程序 时 ; 
虽然 是 自己 调用 自己 ， 但 首先 应 该 知道 可 以 直接 解决 的 问题 ， 对 于 不 可 直接 解决 的 问题 ， 
可 以 将 它 逐 渐 向 可 以 解决 问题 的 方向 引进 。 例 如 参数 的 逐渐 减少 或 增加 ， 能 够 到 达 直接 解 
决 问题 的 这 一 步 ， 否 则 就 变 成 死 循 环 ， 也 就 是 计算 机 不 能 解决 的 问题 。 
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递归 程序 编写 昌 然 简单 但 在 时 间 和 空间 上 往往 是 不 节省 的 。 
递归 是 一 种 比较 好 的 程序 设计 方法 ， 比 较 典 型 的 范例 是 汉 内 塔 、 禾 学 上 的 阶乘 以 及 最 
大 公 因 了 于 等 问题 。 下 面 仅 以 阶乘 问题 来 说 明 递归 。 


阶乘 定义 为 : 
] n=0 
: | n*(n- ly n>l 
程序 设计 方法 : 


(1) 递归 结束 条 件 ” 当 阶乘 小 于 或 等 于 1 时 ， 返 回 1。 
(2) 递归 执行 部 分 ” 当 阶 乘 大 于 1 时 ， 返 回 nt=n*(n- 11。 
算法 为 ; 
public ciass factor 
人 
public static void main (string ards[]) 
{ 
int number: 
tnt factorial; 
System.out.print( Please enter a number"); 
consolereader console=new consolereader(system.in); 
number~console.readint(); 
factertal=factor(number); 
system.out.print (number+"!"); 
system.out.print("="+factorial); 
和 
public static int factor(int mn) 
if (n<=1) 
return ] : 
else 
return n*factor(n-1); ”WW 自 己 调用 自己 ， 但 是 参数 况 渐 减少 ， 和 最 后 思 能 够 达到 n 
的 值 等 于 0 的 时 候 


} 


4. 递归 的 非 递 归 实 现 


在 递归 程序 中 ， 主 要 就 是 一 个 堆栈 的 变化 过 程 ， 程 序 执行 过 程 中 ， 堆 栈 是 由 系统 自动 
实现 的 ， 但 是 读者 应 该 能 够 将 递归 的 程序 变 为 非 递归 的 实现 。 | 

在 非 递 归程 序 中 ， 需要 了 解 的 是 什么 数据 需要 或 什么 时 间 压 入 堆栈 什么 数据 需要 或 
在 什么 时 候 弹 出 堆栈 。 
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例如 上 例 中 的 阶乘 问题 ， 使 用 非 递 归 实 现 ， 可 以 考虑 实现 将 不 同 的 n 压 入 堆栈 ， 每 次 
减 1， 最 后 能 够 实现 0 的 阶乘 的 计算 ， 然 后 返回 ， 直 到 堆栈 为 空 为 止 。 


public class factor 


public static void main (string ards{]) 


int number: 
int factorial; 
system.out.print("please enter a number"); 
consolereader console=new consolereader(system.in); 
number=console.readint(): 
top=null; 
while (number!=0) 
t 
top=new link(number,top); 
number--; 
} 
factorial=1. 
while (top!=null) 
{ object it=top.element(); // 保 留 弹出 的 元 素 
top=top.next(); // 修 改 栈 顶 指针 


factorial=it*factorial; 


} 


return factorial: 


} 


3.2 队 列 


3.2.1 队列 定义 及 基本 概念 


1. 队列 定义 


队 的 操作 是 在 两 端 进行 ， 其 中 一 端 只 能 进行 插入 ， 该 端 称 为 队列 的 队 尾 ， 而 另 一 端 只 能 
进行 人 删除， 该 端 称 为 队列 的 队 首 。 队 列 在 我 们 日 常生 活 中 经 常 碰 到 ， 例 如 ， 排 队 买 东西 ， 谁 
先 来 ， 谁 先 买 ， 买 完 就 走 ， 谁 后 来 ， 谁 在 队 的 最 后 面 排队 ， 再 如 ， 同 一 台 打 印 机 打印 多 份 文 
件 ， 可 以 在 打印 任务 栏 中 发 现 ， 有 多 个 打印 任务 在 排队 等 待 打印 ,而 当前 正在 打印 第 一 份 文 
件 。 一 般 情况 下 ， 入 队 操 作 又 称 为 队列 的 插入 ， 出 队 操 作 又 称 为 队列 的 删除 。 队 列 的 运算 规 
则 是 FIFO(First In First Out)， 或 者 叫做 先进 先 出 规则 。 队 列 的 逻辑 图 如 图 3-13 所 示 。 
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入 队 -一 如 出 队 一 一 


图 3-13 ”队列 入 出 队 的 还 辑 图 


队列 的 入 、 出 队 操 作 分 别 具 有 入 队 和 出 队 指 针 ， 通 常 以 ftfronb 表 示 队 首 指针 ，rGrear) 
表示 队 尾 指针 。 
队列 的 存储 具有 顺序 存储 和 链 式 存储 两 种 。 


注意 : 

队列 在 顺序 存储 时 ， 经 常 出现“ 假 溢出 ” 现 歉 ， 解决 “ 假 溢出 ”现象 的 方法 有 很 多 种 ， 
例如 ， 设 定 队 首 指针 不 动 ， 只 要 插入 元 素 ， 在 队列 的 末尾 直接 插入 ， 只 要 删除 元 素 ， 从 队 
首 的 位 置 直接 删除 就 可 以 了 ， 队 首 的 指针 一 直 是 确定 的 。 但 是 这 种 方法 通常 需要 造成 大 量 
的 数据 元 素 移 动 。 所 以 解决 “ 假 溢 出 ”比较 好 的 方法 是 ， 将 队列 采用 循环 队列 方式 存储 ， 
也 就 是 使 得 队列 的 队 首 和 队 尾 指针 循环 起 来 。 队 列 主 要 用 于 某 种 先后 顺序 处 理 的 问题 中 ， 
如 操作 系统 的 作业 调度 、 打 印 任务 的 调度 等 。 


2. 队列 的 基本 运算 


队列 的 基本 运算 通常 和 堆栈 的 基本 运算 类 似 ， 有 以 下 6 种: 
置 空 队 ; /构造 一 个 空 队列 。 

判 对 空 ; / 队 空 妈 回 真 ， 否 则 返回 假 。 

判 对 满 ，W/ 队 满 返回 大， 人 则 返回 假 ， 仅 限于 顺序 存储 结构 。 
入 队 ; /队列 非 满 时 ， 从 队 尾 插入 元 素 。 

出 队 ; W 队 列 非 空 时 ， 从 队 首 删除 元 素 。 

取 队 讶 元素; /退回 队 首 元 素 ， 不 修改 队 首 指针 。 


3.2.2 ”顺序 队列 


队列 的 顺序 存储 结构 称 为 顺序 队列 ， 顺 序 队列 实际 上 是 运算 受 限 的 顺序 表 。 和 顺序 表 
一 样 ， 顺 序 队列 也 必须 用 一 个 向 量 空 间 来 存放 当前 队列 中 的 元 素 。 由 于 队列 的 队 头 和 队 尾 
的 位 置 是 变化 的 ， 因 而 要 设置 两 个 指针 front 和 rear 分 别 指示 队 头 元 素 和 队 尾 元 素 在 向 量 
空间 中 的 位 置 ， 它 们 的 初 值 在 队列 初始 化 时 可 以 置 为 0。 入 队 时 将 新 元 素 插入 rear 所 指 的 
位 置 ， 然 后 将 rear 加 1。 出 队 时 ， 删 去 front 所 指 的 元 素 ， 然 后 将 front 加 1 并 返回 被 删 元 
素 。 由 此 可 见 ， 当 头 尾 指 针 相 等 时 队列 为 空 。 在 非 空 队列 里 ， 头 指针 始终 指向 队 头 元 素 ， 
而 尾 指针 始终 指向 队 尾 元 素 的 下 一 个 位 置 。 

队列 同 堆栈 一 样 也 有 上 溢 和 下 溢 现 象 。 此 外 ， 队 列 中 还 存在 “ 假 滋 出” 现象。 所谓 “ 候 
溢出 ”是 指 在 入 队 和 出 队 操作 中 ， 头 尾 指针 不 断 增加 而 不 减 小 或 只 减 小 而 不 增加 ， 致 使 被 


.68 。 数据 结构 与 算法 分 析 (Java 版 ) 


删除 元 素 的 空间 无 法 重新 利用 ， 最 后 造成 队列 中 有 空闲 空间 ， 但 是 不 能 够 插入 元 素 ， 也 不 
能 够 删除 元 素 的 现象 。 因 此 ， 尽 管 队列 中 实际 的 元 素 个 数 远 远 小 于 向 量 空间 的 规模 ， 但 也 
可 能 由 于 尾 指 针 已 超越 向 量 空 间 的 上 界 而 不 能 进行 入 队 或 出 队 操作 。 该 现象 称 为 假 上 洲 。 

解决 假 上 溢 现 象 的 方法 有 很 多 种 ， 如 固定 队 首 指针 ， 一 旦 删除 元 素 ， 需 要 移动 所 有 元 
素 后 ， 修 改 队 尾 指针 ， 这 样 又 可 以 插入 元 素 了 ， 只 有 在 不 能 插入 元 素 时 ， 队 列 才 满 ， 否 则 
可 以 一 直播 入 元 素 ， 这 种 方法 虽然 能 够 解决 “ 假 溢 出 ”， 但 需要 造成 大 量 的 数据 元 素 的 移 
动 。 现 在 解决 “ 假 游 出 ”比较 好 的 解决 方案 是 使 用 循环 向 量 ， 存 储 在 循环 向 量 中 的 队列 称 
为 循环 队列 (Circular Quene)， 如 图 3-14 所 示 。 : 


front 


以 


图 3-14 循环 队列 的 逻辑 图 


假设 问 量 的 空间 是 m， 只 要 在 入 出 队列 时 ,将 队 首 和 队 尾 的 指针 对 m 做 求 模 运算 即 可 
实现 队 首 和 队 尾 指针 的 循环 ， 即 队 首 和 队 尾 指针 的 取 值 范围 是 0 到 六 -1 之 间 。 

入 队 时 ;rear=(reart+1)% maxsize 

出 队 时 ;front=(front+1)% maxsize 

但 是 入 队 和 出 队 时 front 和 rear 的 取 值 不 能 够 确定 队列 的 室 和 满 。 因 为 入 队 时 ，rear 
指针 不 断 增 加 一 个 ， 当 rear 指针 “ 追 上 ”front 指针 时 ， 队 列 已 经 满 了 ， 此 时 满 的 条 件 是 
rear=front; 反之， 当 出 队 时 ，front 指针 不 断 增加 一 个 ， 当 front 指针 “ 追 上 ”rear 指针 时 ， 
队列 已 经 空 了 ， 此 时 队列 空 的 条 件 是 rear=front。 由 此 可 见 ， 队 空 和 队 满 的 条 件 是 相同 的 ， 
都 是 front=rear。 

”区 分 队 空 和 队 满 的 方法 有 多 种 。 

方法 一 : 可 以 设置 浪费 一 个 空间 单元 , 也 就 是 假定 rear 指向 的 是 刚刚 插入 元 素 的 位 置 ， 
front 指向 刚刚 删除 元 素 的 位 置 。 

也 就 是 说 在 入 队 时 ， 先 不 修改 rear 的 值 , 而 是 先 判断 (rear+1) % maxsize=front， 如 果 成 

立 , 表示 队列 已 满 ( 此 时 实际 还 有 front 指 问 的 位 置 空 闪 )， 出 队 时 ， 只 要 判断 front=rear， 如 
村 直立 表示 队 已 空 否则 只 要 front=(front+1) % maxsize 直接 删除 元 素 即 可 。 此 种 方法 存储 
的 数据 元 素 个 数 是 maxsize - 1， 是 利用 浪费 一 个 空间 来 换取 队 空 与 满 的 条 件 。 

方法 二 : 设 定 一 个 变量 来 表示 队列 中 的 元 素 个 数 ， 利 用 该 变量 的 值 与 队列 的 最 大 容量 
比较 ， 如 有 果 该 变量 的 值 与 最 大 容量 相等 ， 则 表示 队 满 ， 如 果 该 变量 的 只 为 0， 则 表示 队列 
为 空 。 此 方法 与 第 一 种 方法 的 不 同 之 处 在 于 ， 每 次 入 队 、 出 队 一 个 元 素 时 ， 需 要 修改 队列 
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中 的 数据 元 素 的 个 数 。 

以 上 两 种 方法 ， 虽 然 都 能 够 区 分 队 空 与 队 满 ， 但 是 都 需要 增加 一 个 存储 单元 的 结构 
开销 。 

实现 循环 队列 需要 两 个 指针 的 开销 ， 分 别 是 front 和 rear， 需 要 定义 数组 的 最 大 下 标 ， 
在 实现 入 /出 队 时 ， 一 定 要 遵循 “先进 先 出 ”的 规则 。 

循环 队列 的 基本 运算 为 ; 


class squeue{ 

private static final int defaultsize=10; 

private int size; 

private int front; 

private int rear; 

private object{]) listarray; 

squeue() 

{setup(defaultsize); 

| 

squeuelint sz}{setup(sz);} /设置 大 小 
vold setup(int sz) 

《Size=sz+1， 
fronr=rear=0; 

. listarray=new object[sz+1];} /队列 初始 化 
public void clear() /队列 清空 
{front=rear=0;} 

public void enequeue(object it) /入 队 一 个 元 和 紊 
{ assert.notfalse(((rear+1)%size)!=front,"queueis full"): 
rear=(reart+]1)%%size; 
listarray[rear}=it;} . 
public object degueue() // 出 队 一 个 元 素 
{ assert.notfalse(lisempty()," queue is empty" 
front=({front+ 1 )%size; 
return listarray[front]l; 
} 
public object firstvalue() // 取 队 首 元 素 
{ assert.notfalse(!lisempty(),"queue is empty"); 
return listarray[(front+1)%sizel: 
} 
public boolean isemptyO() 1/ 测试 队列 是 否 为 空 
{return front==rear;} : | 
} Hclass Squeue 


实现 方法 中 ， 队 首 存 放 在 数组 中 编号 较 低 的 位 置 ( 沿 顺 时 针 方向 )， 队 尾 存 放 在 数组 中 
编号 较 高 的 位 置 。 
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3.2.3” 链 式 队 列 


定义 链 队 列 的 存储 结构 基本 和 线性 表 的 定义 相同 ， 不 过 需要 在 结构 中 指明 的 是 队 首 和 
队 尾 的 数据 类 型 不 再 是 整 型 而 是 指针 类 型 。 
队列 的 各 种 运算 比 链 式 存储 的 普通 线性 表 运 算 实 现时 要 方便 得 多 ， 主 要 原因 是 队列 的 
各 种 运算 只 能 在 队列 的 两 端 操作 ， 队 列 是 特殊 的 线性 表 ， 我 们 只 要 考虑 对 线性 表 的 两 端 操 
作 的 情况 ， 并 且 只 能 一 端 插 入 ( 队 首 )， 为 一 端 删除 ( 队 尾 )， 而 线性 表 除 此 之 外 (不 限定 一 端 
插入 、 一 端 删除 )， 还 需要 考虑 中 间 结 点 的 插入 、 删 除 、 查 询 等 操作 ， 可 以 把 队列 的 入 出 队 
运算 当 作 线性 表 两 端 进行 插入 、 删 除 的 特例 。 
主要 考虑 队列 的 入 队 和 出 队 算 法 。 其 原因 是 在 队列 的 基本 运算 中 有 6 种: 判断 队 空 、 
队列 初始 化 、 判 断 队列 满 ( 仅 限于 顺序 存储 的 情况 下 )、 入 队 元 素 、 出 队 元 素 、 取 队 首 元 素 
等 。 而 入 队 时 需要 操作 的 步骤 是 初始 化 ， 然 后 判断 队列 是 否 为 满 ， 如 果 不 满 ， 则 可 以 插入 
元 素 ( 入 队 );， 出 队 时 ， 需 要 考虑 的 操作 步骤 是 判断 队列 是 否 为 空 ， 如 果 不 空 ， 删 除 元 素 ( 出 
队 ),， 出 队 之 前 , 保存 队 首 元 素 。 也 就 是 说 ,队列 的 入 出 队 运 算 包 含 了 其 他 的 6 种 基本 运算 ， 
取 队 首 元 聚 的 运算 ， 只 是 不 用 修改 队 首 的 指针 而 已 。 / | 
以 单 问 链表 存储 队列 为 例 ， 只 要 保留 末尾 结 点 指针 (假设 是 队 尾 指针 ) 即 可 ， 主 要 原因 
是 如 果 保存 队 首 和 队 尾 指针 ， 结 构 开 销 较 大 。 由 于 在 循环 队列 中 ， 已 知 任意 结 点 ， 可 以 找 
到 所 有 结 点 ， 所 以 只 要 保留 一 个 结 点 就 可 以 了 。 如 果 已 知 结 点 的 指针 是 头 结 点 指针 ， 此 时 
入 队 、 出 队 运 算 的 时 间 复 杂 度 为 O(n)( 主 要 时 间 花 费 在 查询 结 点 上 )， 而 如 果 已 知 结 点 的 指 
针 是 末尾 结 点 指针 ,此 时 不 需要 查询 结 点 , 直接 进行 入 队 和 出 队 运算 , 时 间 复 杂 度 为 0(1)， 
各 种 运算 实现 也 比较 方便 。 
class linkqueue { 
private link front; // 队 首 指 针 
private link rear; / 队 尾 指针 
public linkqueue(){ setup(); } 
public linkqueue(int sz){setup(); } 
/初始 化 
private vold SetupO 
{front=rear=—null; } 
public void clear() {fron=rear=null; } /清空 队列 
// 插 入 元 素 
public vold enqueue(object it)t 
if (rear!=null){ 
rear.setNext(new linkQit,null)); 


rear=—rear.next(); 
} 
else front=rear=new link(it, null): 
} 
/删除 元 素 
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public object dequeue(){ 
assert.notfalse(!lisempty()); 
object it=front.element(); 
front=front.next(); 
if(front—null) rear=nuli; 
return it; 
和 
/到 队 首 元 素 
public object firstvalue() 
{assert.notfaise(lisempty()); 
return front.element(); } 
jj 测试 队列 是 否 为 空 
public boolean isempty() 
{return front=—=null; } 
} Wclases linkqueue 


注意 ， 在 出 队 算法 中 ， 一 般 只 需 修 改 队 头 指针 。 但 当 原 队 中 只 有 一 个 结 点 时 ， 该 结 点 
召 是 队 头 也 是 队 尾 ， 故 删 去 此 结 点 时 亦 需 修改 尾 指针 ， 且 删 去 此 结 点 后 队列 变 空 。 


3.2.4 队列 的 应 用 


在 客户 /服务 关系 中 ， 当 请 求 的 速度 超过 服务 所 能 提供 的 速度 时 ， 应 该 想到 使 用 队列 解 
决 。 例 如 车 辆 进入 收费 点 时 ， 需 要 排队 等 候 ， 恰 好 是 满足 先进 先 出 的 规则 ， 使 用 队列 比较 
容易 解决 ， 在 计算 机 中 使 用 编辑 软件 编辑 文字 之 后 ， 连 续 发 出 多 条 打印 命令 ， 此 时 打印 任 
务 也 处 于 排队 状态 ， 适 宜 使 用 队列 解决 。 


1. 合并 两 个 队列 


假设 有 两 个 队列 ， 要 求 将 两 个 队列 合并 到 一 起 ， 合 并 时 交替 使 用 两 个 队列 中 的 元 素 ， 
并 把 剩余 队列 中 的 元 素 添 加 在 最 后 ， 将 产生 的 新 队列 返回 。 


Public static ArrayQueue merged(ArrayQueue ql, ArrayQueue q2) 
{ ArrayQueue newQueue= new ArrayQueue(); : 
while (lql.IsEmpty() &&!q2.IsEmpty) 
{newQueue.enqueue(ql.dequeue()); 
newQueue.enqueue(q2.dequeue()); 
} 
while (lql.IsEmpty()) 
newQueue.enqueue(gl1.dequeue()); 
while (1g2.IsEmpty()) 
newQueue.enqueue(q2.dequeue()); 
return newqueue: 


} 


*。72。 数据 结构 与 算法 分 析 (jaya 版 ) 


2. 模拟 客户 服务 系统 


在 客户 /服务 关系 中 ， 当 遇 到 请 求 速 度 超 过 服务 所 能 提供 的 速度 时 ， 将 自然 地 想到 用 队 
列 来 进行 模拟 实现 ， 例 如 ， 当 汽车 到 达 收 费 站 时 ， 在 它 能 进入 某 个 服务 口 之 前 它 需 要 排队 
等 待 ， 刚 好 体现 了 队列 先进 先 出 的 运算 规则 ， 可 以 孝 谍 使 用 队列 实现 之 ， 再 如 ， 使 用 计算 
机 进行 打印 时 ， 往 往 发 出 多 个 打印 命令 ， 要 求 打印 机 打印 ， 此 时 打印 任务 中 有 多 个 打印 在 
排队 等 候 ， 对 打印 任务 而 言 ， 刚 好 体现 了 队列 先进 先 出 的 运算 规则 ， 可 以 考虑 使 用 队列 实 
现 之 ; 超市 的 入 口 和 出 口 排队 时 ， 也 可 以 考虑 使 用 队列 实现 ， 因 为 它们 满足 先进 先 出 规则 
等 。 在 实际 应 用 过 程 中 需要 使 用 队列 的 例子 有 很 多 。 下 面 以 打印 作业 为 例 说 明 模拟 客户 服 
务 系统 。 四 

对 打印 机 作业 用 它 的 ID 号 以 及 它 的 大 小 进行 标识 ， 对 打印 作业 的 有 效 模拟 需要 使 用 
随机 产生 的 数字 输入 ， 一 个 用 来 产生 每 台 打 印 机 的 平均 打印 速度 ， 一 个 用 于 为 每 台 打印 机 
的 各 打印 作业 产生 打印 速度 ， 一 个 用 于 产生 打印 作业 的 到 达 间 除 ， 该 Random 类 是 
java.util.random 类 的 扩展 类 。 


public class random extends java.util.random 
{private double mean; 
private double standardDeviation; 
public Random(double mean) 
{this.mean=mean; 
this.standardDeviation=mean; ”| 
) z 
public Random(double mean,double standardDeviation) 
tthls.mean=mean， 
thls.standardDeviation=standardDeviation， 
public double nextGaussian() 
{double x=super.nextGaussian(); //x=normal(0.0, 1.0) 
return x*standardDeviation + mean: / 四 
} | 
public double nextExponential() 
{returmn -mean*Math.log(].0 - nextDouble()): 
和 
public int intNextExponential() 
{return (int)Math.ceil(nextExponential()); 
和 


其 中 的 nextGaussian( 方 法 将 返回 一 个 随机 数 , 随机 数 按 给 定 的 平均 数 和 标准 偏差 值 下 
态 分 布 ， 它 调用 并 霜 盖 了 java.util.random 类 中 的 匿名 方法 ， 该 匿名 方法 返回 的 随机 数 按 平 
均 数 为 0.0， 而 标准 偏差 值 为 1.0 进行 正 态 分 布 。 方 法 nextExponential0 返 回 的 随机 数 按 给 
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定 平均 数 进行 指数 分 布 ， 这 是 用 于 随机 到 达 间 了 时 间 的 一 个 比较 准确 的 分 布 ， 它 也 用 于 产 
生 作 业 的 大 小 ， 而 该 大 小 将 用 于 确定 服务 所 需 的 时 间 。 
每 个 打印 作业 是 以 下 类 的 一 个 实例 。 


public class Client 

{public static final int MEAN JOB SIZE:100; 
private static Random randomJobSize:new Random(MEAN JOB SIZEF); 
private static int nextld=0; 

private int id, jobSize, tArrived, tBegan, tended; 
private Server Server; 

public Client(int time) 

{ 1d=++nextld; 
JobSize=randomJobSize.intNextExponentiai( ): 
// tArrived=time; 

print(id,time,JobSize); 

public double getJobSize() 

{ return jobSize; 

4 

public Int getWaitTime() 

{ return tBegan - tArrived; 

} 

public int getServiceTime() 

{ return tEnded - tBegan; 

} 

public void beginService(Server server, int time) 
{ this.server = server; 

//tBegan = ftme; 
printBegins(server,id,time); 

} 

public void endService(int time) 

{ //tEnded = time; 
printEnds(server,id,time); 

Server = null: 

} 

public string toString() 

{ return "#"” + 这 + "(” + (intMath.roundGobSize) + 由" 


} 

private static void print(int job, int time, double size) 

{ System. out. printin("job # + job + " arrives at time " + time 
+ "7 with"” + (int)Math. round(size) + "pages."): 

private static Void printBegins(Server server, int job, int time) 

{ System.Out.println("Printer ” + server + " begins job #" + job 


+ "at time ”+ time + "."); 


。74。 


随机 数 产 生 器 randomJobSize 产生 指数 分 布 的 作业 大 小 ， 平 均 页 数 为 100 页 。 它 被 声 
明 为 static， 这 是 由 于 一 个 实例 就 足以 产生 所 有 作业 的 大 小 。 同 样 ，static int nextid 用 于 所 
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#" 


+ job 


} z 

private static Void printEnds(Server server, int Jjob, int time) 
{ System.out.println("Printer “ + server + ”ends job 

+ ”at time ”+ tme + ™.); 

| 


有 作业 的 标识 数 。 


构造 函数 使 用 nextid 计数 器 来 为 作业 设置 id 号， 同时 它 还 使 用 了 randomJobSize 产生 
器 来 设置 作业 的 大 小 ， 然 后 它 打 印 一 行 输出 ， 宣 布 该 作业 已 经 到 达 。 

方法 beginService() 将 打印 机 赋值 给 server 引用 ， 并 输出 一 行 ， 表明 打 印 已 经 开始 ， 同 
样 ，endService() 方 法 先 打印 一 行 ， 宣 布 该 打印 作业 结束 ， 然 后 把 空 值 赋值 给 server 引用 。 


每 个 打印 机 是 以 下 类 的 一 个 实例 。 


public class Server 


{private static Random random MeanServiceRate:new Random(1.00, 0.20); 


private static char nextid='A.'; 

private Random randomServiceRate; 

private char 1d; 

Private double meanServiceRate,serviceRate; 

prmvate Client client; 

private nt ttmeServiceEnds; 

public Server() 

{id= (char)nextid+t+; 

meanServiceRate = randomMeanServiceRate.nextGaussian(); 
randomServiceRate = new Random(meanServiceRate,0.10); 
| 

public Client getClient() 

{return client; 

} 

public void beginServing(Client client,int time) 

{this.client = client; 

serviceRate = randomServiceRate.nextGaussian(); 
client.beginService(this,time); 

int serviceTime = (int)Math.ceil(client.getJobSize() / serviceRate): 
timeServiceEnds = time + serviceTime: 

} 

public vold endServing(int time) 

‘client.endService(time); 


this.client = null， 
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public int getTimeServiceEnds() 


{return timeServiceEnds.; 

} 

public boolean isFree() 

{return client = null: 

} 

public String toString() 

{int percentMeanServiceRate = (int)Math. round(100+meanServiceRate). 
int percentServicerate = (int)Math.round(100*serviceRate); 

return id + "(" + percent MeanServiceRate + "%" + percentServiceRate oy" 
} 

4 


随机 数 产 生 器 randomMeanServiceRate 产生 一 个 平均 数 为 100.0， 而 标准 偏差 为 
20.0 的 正 态 分 布 的 打印 速度 随机 值 ， 为 每 台 打 印 机 产生 一 个 meanServiceRate 值 。 正 如 本 
次 运行 所 示 , 它 为 Printer A 产生 的 打印 速度 值 为 89%, 它 为 Printer B 产生 的 打印 速度 值 为 
97%, 它 为 Printer C 产生 的 打印 速度 值 为 106%, 而 为 Printer D 产生 的 打印 速度 值 为 128%。 
同样 ， 随 机 数 产 生 器 randomServiceRate 为 某 个 打印 作业 产生 正 态 分 布 的 速度 值 。 在 所 显示 
的 运行 中 ， 它 为 作业 #1 所 产生 的 速度 为 84%， 为 作业 #3 所 产生 的 速度 为 87%， 为 作业 #5 
所 产生 的 速度 为 92%， 这 些 数值 来 源 于 平均 数 为 89% 的 正 态 分 布 (对 Printer A)， 而 标准 偏 
差 值 设 为 10%。 

方法 beginServingO 将 要 打印 的 客户 作业 赋值 给 client 引用 ， 并 从 产生 器 
randomServicerate 那里 获得 正 态 分 布 的 serviceRate 值 ， 然 后 将 beginService 消息 发 送 给 客户 
打印 作业 ， 接 下 来 ， 赋 值 语句 int serviceTime=(int)Math.ceil(client.getJobSize( / serviceRate): 
完成 打印 作业 所 需 的 时 间 ( 秒 数 ), 该 值 是 用 作业 大 小 (页 面 数 ) 除 以 打印 速度 (每 秒 多 少 页 ) 来 获 
得 的 ， 然 后 将 该 值 加 入 到 Server 对 象 中 的 timeServiceEnds 时 间 段 中 。 

下 面 是 main 方法 所 在 的 类 定义 。 


import schaums.dswj.Queue; 

public class ClientServerSimulation 

{private static final int NUMBER OF SERVERS = 4: 

private static final double MEAN INTERARRIVAL TIME = 20.0; 
private static final int DURATION = 100， 

private static Server[] servers = new Server[INUMBER OF PR VERS}; 
private static Queue clients = new ArrayQueue(); 

private static Random random = new Random(MEAN INTERARRIVAL TIME)， 
Public static void main(String{] args) 

{for(int 1=0;i<NUMBER OF SERVERS;i++) 

servers[i] = new Server(); 


Int timeofNextArrival = random.intNextExponential(); 
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for (int t=0; t<DURATION; t+ 十 ) 

{if(t == timeofNextArrival) 

{clients.enqueue(new Client(t)); 

print(clients); 

timeofNextArrival += random. intNextExponential(); 

} 

for (int i=0;I<NUMBER OF SERVERS;i++) 

if (servers[i].isFree()) 

{if(Iclients.isEmpty()) 

{servers[i].beginServing((Client)clients.dequeue( ),t); 

print(clients); 

} 

) 

else 1f(t == servers[i}.get TImeServiceEnds()) 

serversli].endServing(t); 

} 

private static void print(Queue queue) 

{int size = queue. size(); 

if(size == 0) System.out.println("The queue 1s now empty."); 

else 

System.out.println(”IThe queue flow contains" + size + “job"+ (size>1?"s:":":")+ queue), 
} 
} 
主 循环 在 每 个 时 间 间 隔 均 迭代 一 次 ， 称 这 样 的 模拟 实现 为 时 间 驱 动 模拟 ， 相 反 ， 如 采 

主 循环 是 在 某 个 事件 发 生 时 才 途 代 一 次 ， 就 称 其 为 事件 驱动 的 模拟 实现 。 事 件 可 以 是 新 作 
业 的 到 达 、 服 务 的 开始 或 服务 的 结束 。 事 件 驱动 模拟 程序 通常 更 为 简单 ， 但 要 求 所 有 的 服 
务 器 具有 相同 的 工作 速度 。 


思考 和 练习 


1. 基础 知识 题 


(1) 向 顺序 堆栈 插入 新 元 素 分 为 3 步 : 第 1 步 ， 进行 。 判断, 判断 条 件 是 ; 
第 2 步 修 改  ; 第 3 步 把 新 元 素 赋 给 。” _。 同样 从 顺序 堆栈 删除 元 素 分 为 3 步 : 第 
1 步 ， 进 行 判断， 判断 条 件 是 ” ”; 第 2 步 把 。 值 返 回 ; 第 3 步 ” ，。 

(2) 设 有 一 个 栈 ， 元 素 依次 进 栈 的 顺序 为 4、B、C、D、E。 下 列 。 ” 是 不 可 能 的 出 
栈 序列 。 

(aj A,B,C,D,E (b B,C,D,E,A (C} EABCD (dE,D,CB,A 
(3) 何谓 队列 的 上 溢 现 象 ? 一 般 使 用 什么 方法 解决 ? 试 简 述 之 。 
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(4) 简 述 栈 与 队 的 不 同 之 处 。 
(5) 简 述 顺序 存储 队列 为 何 采 用 循环 队列 的 存储 方式 。 
(6) 循环 链表 与 单 同 链表 在 处 理 方法 上 有 何不 同 之 处 。 
(7) 简 述 中 级、 前 级 、 后 缀 的 不 同 点 。 
(8) 简 述 一 元 多 项 式 的 栈 运算 过 程 。 / 
(9) 设 将 整数 1、2、3、4 依次 进 栈 , 但 只 要 出 栈 时 栈 非 宇 ， 则 可 将 出 栈 操作 按 任何 次 
序 压 入 其 中 ， 回 答 下 述 问 题 ; 
@) 若 入 、 出 栈 次 序 为 Push(1)、PopO0、Push(2)、Push(3)、PopO0、PopO、Push(4)、Pop0， 
则 出 栈 的 数字 序列 是 什么 (这 里 Push(i) 表示 i 进 栈 ，PopO 表 示 出 栈 )? / 
能 否 得 到 出 栈 序列 1423 和 1432， 并 说 明 为 什么 不 能 得 到 或 者 如 何 得 到 。 
分 析 1、2、3、4 的 24 种 排列 中 ， 哪 些 序 列 是 可 以 通过 相应 的 入 出 栈 操作 得 到 的 。 
(10) 链 栈 中 为 何不 设置 头 结 点 ? 
(11) 循环 队列 的 优点 是 什么 ? 如 何 判别 它 的 空 和 满 ? 
(12) 设 长 度 为 n 的 链 队 列 用 单 循环 链表 表示 ， 若 只 设 头 指针 ， 则 入 队 出 队 操 作 的 时 间 
是 什么 ? 若 只 设 尾 指针 了 呢 ? 
(13) 简 述 以 下 定义 : 栈 、 队 列 和 递归 。 
(14) 从 现实 生活 中 举例 说 明 栈 和 队列 的 特征 。 
(15) 举例 说 明 栈 的 “上 游 ”、“ 下 浇 ” 现 象 。 
(16) 举例 说 明 顺 序 队 列 的 < 假 游 出 ” 现象 。 
(17) (BD 如果 以 链表 作为 栈 的 存储 结构 ， 则 退 栈 操作 时 
(a) 必须 判别 栈 是 否 满 。 (b) 判别 栈 元 素 的 类 型 
(ce) 必须 判别 栈 是 否 空 ”“(d) 对 栈 不 作 任何 判别 
Go 设 C 语 言 数组 Datafm+1] 作 为 循环 队列 SQ 的 存储 空间 , front 为 队 头 指针 ,rear 
为 队 尾 指 针 ， 则 执行 出 队 操 作 的 语句 为 


(a) front=front+1 (b) front=(front+1)Y%om 
(cj front=(frontt1)%(m+1) (d) rear=(reart 1 )Y%om 
(18) 栈 称 为 线性 表 。 队 称 为 ” _ 线性 表 ，。 详 一 个 链 烧 的 栈 项 页 指针 为 LS， 
栈 中 结 点 的 格式 为 : 
则 栈 空 的 条 件 是 ” ， 如 果 栈 不 为 空 ， 则 退 栈 操作 步骤 为 


(19) 某 队 列 初 始 为 空 ， 基 它 的 输入 序列 为 a bp、c、d， 它 的 输出 序列 应 为 。 。 
(a)}a, b, c, d (b)d, c, b, a (c)ja, c, b, d (da a, c, b z z 
(20) 当 4 个 元 素 的 进 栈 序列 给 定 以 后 ， 由 这 4 个 元 素 组 成 的 可 能 的 出 栈 序列 应 该 有 





(a)24 种 (bj)17 种 (cj)16 种  (d)14 种 






把 


(21) 设 n 个 元 素 的 进 栈 序 列 为 1，2，3，……… ，1， 出 栈 序列 为 pl，p2，p3， ， Pn’ 
吉 pi=n， 则 产 (1 委 站 四 的 值 为 
(a)i (b)n-i (c)n-itl ”(d) 有 多 种 可 能 


(22) 人 充 n 个 元 素 的 进 栈 序列 为 pl，p2，p3，…… ，pn， 出 栈 序列 为 1，2，3，…… ，h， 
在 piF1， 则 疡 (1 科普 四 的 值 为 
(a)i (Wn-i (cjn-itl  ”(d) 有 多 种 可 能 
(23) 大 堆栈 采用 顺序 存储 结构 ， 正 常情 况 下 ， 往 堆栈 中 插入 一 个 元 素 ， 栈 顶 指针 top 
的 变化 是 。 
(a) 不 变 (b) top=0 _ (c¢) top-- (d) top++ 
(24) 者 堆栈 采用 顺序 存储 结构 ， 正 常情 况 下 ， 删 除 堆栈 中 一 个 元 素 ， 栈 顶 指针 top 的 
变化 是 
(a) 不 变 。 (b) top=0 (cj top-- (d) top++ 
(25) 大 队列 采用 顺序 存储 结构 ， 元 素 的 排列 顺序 
(a) 与 元 素 的 值 的 大 小 有 关 
(b) 由 元 素 进 入 队列 的 先后 顺序 决定 
(c) 与 队 头 指针 和 队 尾 指针 的 取 值 有 关 
(d) 与 作为 顺序 存储 结构 的 数组 的 大 小 有 关 
(26) “链接 队列 ”这 一 概念 不 涉及 
(a) 数据 的 存储 结构 (b) 数据 的 逻辑 结构 
(c) 对 数据 进行 的 操作 。  ”(d) 链表 的 种 类 
(27) 在 循环 队列 中 ， 者 front 与 rear 分 别 表 示 队 头 元 素 和 队 尾 元 素 的 位 置 ， 则 判断 循 
环 队 列队 空 的 条 件 是 。 
(aj front=rear+1 (hb) rear=frontt+l (c) front=rear (d) front=0 


2. 算法 设计 题 


(1) 用 标志 位 方式 设计 在 循环 队列 中 入 队 算 法 。 

(2) 号 出 顺序 存储 队列 入 队 和 出 队 算法 。 

(3) 写 出 顺序 存储 栈 的 入 栈 和 出 栈 算法 。 

(4) 试 与 出 利用 两 个 堆栈 Si、S5, 模 拟 一 个 队列 的 入 、 出 队 算 法 。 

(5) 回 文 是 指正 读 和 反 读 均 相 同 的 字符 序列 ,如 abba 和 abdba 均 是 回 文 , 但 good 不 是 
四] 文 。 试 与 一 个 算法 判定 给 定 的 字符 向 量 是 否 为 回 文 。 (提示 : 将 一 半 字 符 入 栈 )。 

(6) 利用 栈 的 基本 操作 ， 写 一 个 将 栈 S 中 所 有 结 点 均 删 去 的 算法 。 

(7) 利用 栈 的 基本 操作 ， 与 一 个 返回 栈 8 中 结 点 个 数 的 算法 。 
， (8) 讽 计 算法 判断 一 个 算术 表达 式 的 圆 括 号 是 否 正确 配对 。( 提 示 : 对 表达 式 进 行 扫描 ， 
几 过 “(” 就 进 栈 ， 遇 “)” 就 退 掉 ， 栈 顶 的 “(” 表 达 式 被 扫描 完毕 ， 栈 应 为 空 。 

(9) 一 个 双 同 栈 S 是 在 同一 向 量 空间 内 实现 的 两 个 栈 ， 它 们 的 栈 底 分 别 设 在 向 量 空间 
的 两 端 。 试 为 此 双向 栈 8 设计 初始 化 InitStack(S)、 入 栈 Push(int D 和 出 栈 Pop(int i) 等 算法 ， 
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其 中 i 为 0 或 1， 用 以 指示 栈 号 。 

(10) 用 第 2 种 方法 ， 即 少 用 一 个 元 素 空 间 的 方法 来 区 别 循环 队列 的 队 空 和 队 满 ， 试 为 
其 设计 置 空 队 、 判 队 空 、 判 队 满 、 出 队 、 入 队 及 取 队 头 元 素 等 6 个 基本 操作 的 算法 。 

(11) 假设 以 带头 结 点 的 循环 链表 表示 队列 ， 并 且 只 设 一 个 指针 指向 队 尾 元 素 站 点 ( 注 
意 不 设 头 指 针 )， 试 编写 相应 的 置 空 队 、 判 队 空 、 入 队 和 出 队 等 算法 。 

(12) 对 于 循环 向 量 中 的 循环 队列 ， 写 出 求 队列 长 度 的 公式 。 

(13) 假设 衢 环 队列 中 只 设 rear 和 quelen 来 分 别 指 示 队 尾 元 素 的 位 置 和 队 中 元 素 的 个 
数 ， 试 给 出 判别 此 循环 队列 的 队 满 条 件 ， 并 写 出 相应 的 入 队 和 出 队 算法 ， 要 求 出 队 时 需 返 
回 队 头 元 素 。 

(14) 对 于 筛 环 队 烈 ， 试 写 出 求 队 列 长 度 的 算法 。 

(15) 某 汽 车 轮渡 口 ， 过 江 渡 船 每 次 能 载 10 辆 车 。 过 江 车 辆 分 为 客车 类 和 货车 类 ， 上 
渡船 有 如 下 规定 : 同类 车 先 到 先 上 船 ， 客 车 先 于 货车 上 渡船 ， 有 日 每 上 4 辆 客车 ， 才 人 允许 上 
一 辆 货车 ;车 等 待 客车 不 足 4 辆 ， 则 以 货车 代替 ， 若 无 货车 等 待 允许 客车 都 上 船 。 试 写 一 
算法 模拟 渡口 管理 。 

(16) 可 以 在 一 个 数组 中 保存 两 个 栈 : 一 个 栈 以 数组 的 第 一 个 单元 作为 栈 底 ， 另 一 个 栈 
以 数组 的 最 后 一 个 单元 作为 栈 底 。 设 8 是 其 中 一 个 栈 ， 试 分 别 编写 过 程 push(S,X)( 元 素 X 
入 栈 )、 出 栈 pop(S) 和 取 栈 顶 元 素 top(S)。 提 示 : 设 其 中 一 个 栈 为 0， 另 一 个 栈 为 1。 

(17) 假设 以 市 头 结 点 的 循环 链表 表示 队列 ， 并 且 只 设 一 个 指针 指向 队 尾 元 素 结 点 ( 注 
意 不 设 头 指针 )， 试 编写 相应 的 初始 化 队列 、 入 队列 和 出 队列 算法 。 

(18) 假设 以 数组 cycque[m] 存 放 循 环 队列 的 元 素 ， 同 时 设 变量 rear 和 quelen 分 别 指示 
循环 队列 中 队 尾 元 素 位 置 和 内 含 元 素 的 个 数 。 试 给 出 此 循环 队列 的 队 满 条 件 ， 并 写 出 相应 
的 入 队列 和 出 队列 的 算法 。 
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_ 本章 介 绍 多 维 数组 的 逻辑 结构 特征 及 其 存储 结构 、 特 殊 矩 阵 (主要 是 稀疏 矩阵 ) 的 压缩 
存储 及 广义 表 的 概念 。 


本 章 的 学 习 目 标 : 
。 多 维 数组 的 存储 方式 ; 
。 矩阵 的 压缩 存储 方式 ; 
。 广义 表 的 定义 及 其 表 头 表 尾 的 运算 ; 
。 稀疏 矩阵 的 存储 表示 。 


41 多 维 数 组 


4.1.1 数组 定义 


数组 是 数据 结构 的 基本 结构 形式 ， 它 是 一 种 顺序 式 的 结构 。 数 组 是 存储 同一 类 型 数据 
的 数据 结构 ， 使 用 数组 时 需要 定义 数组 的 大 小 和 存储 数据 的 数据 类 型 。 数 组 分 为 一 维 数组 
和 多 维 数组 。 数组 的 维 数 是 由 数组 下 标的 个 数 确定 的 , 一 个 数组 下 标的 数组 称 为 一 维 数组 ， 
两 个 及 其 以 上 数组 下 标的 数组 称 为 多 维 数组 。 从 这 个 意义 上 讲 ， 确 定 了 对 于 数组 的 一 个 下 
标 总 有 一 个 相应 的 数值 与 之 对 应 的 关系 ;或 者 说 数组 是 有 限 个 同类 型 数据 元 素 组 成 的 序列 。 


数组 的 基本 操作 包括 : 
initarray(&A); /已 始 化 数组 
destroyarray(&A); // 销 毁 数 组 
assign(&A,e); // 数 组 赋值 
value(A,&e); // 取 数组 的 某 个 元 素 
copyarray(M,&T); // 复 制 一 个 数组 
printarray(M); // 打 印 数组 的 元 素 


1. 一 维 数 组 


一 维 数组 是 指 下 标的 个 数 只 有 一 个 的 数组 ， 有 时 称 为 同 量 ， 是 最 基本 的 数据 类 型 ， 在 
Java 中 需要 事先 声名 ， 程 序 才 能 够 在 编译 过 程 中 预 留 内 存 空间 。 声 明 的 格式 一 般 是 : 
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< 数据 类 型 > < 变量 名 称 > [ ]= new < 数据 类 型 > [< 数组 大 小 >]; 
例如 : float numbera=new int[ 引 表示 声明 一 个 长 度 为 5 的 浮 点 数据 类 型 的 一 维 数组 ， 
数组 名 称 为 numbera。 
2. 多 维 数组 
多 维 数组 是 指 下 标的 个 数 有 两 个 或 两 个 以 上 , 我 们 比较 常用 的 是 二 维 数组 (因为 三 维 以 


上 的 数组 存储 可 以 简化 为 二 维 数组 的 存储 )。 下 面 以 二 维 数组 为 例 说 明 多 维 数组 。 二 维 数组 
的 声明 同一 维 数组 。 格 式 为 : 


< 数据 类 型 > < 数组 名 称 > [ ] []j=new < 数据 类 型 >[sizel] [ size2]; 


例如 : int dataf][]=new int 1$][4]; 表 示 声 明 一 个 二 维 数 组 名 称 为 data 的 整 型 数组 ， 共 有 
5 行 ， 每 行 有 4 列 ， 共 可 存储 20 个 数据 元 素 。 


4.1.2 ”数组 的 存储 


1. 一 维 数 组 的 存储 


一 维 数组 的 数据 存储 按照 顺序 存储 ， 逐 辑 地 址 和 物理 地 址 都 是 连续 的 。 如 果 已 知 第 一 
个 数据 元 素 的 地 址 loc(al)， 则 第 i 个 元 素 的 地 址 loc(a)) 为 : 


loc(ai}=loc(ay }+(i - 1)*e 


假设 数组 的 下 标 从 1 开始 ， 只 要 求 出 第 i 个 元 素 之 前 存放 了 多 少 个 数据 元 素 即 可 (实际 
上 有 i- 1 个 元 素 )， 每 个 元 素 占 有 cc 个 存储 单元 ， 再 乘 以 ce， 就 是 第 i 个 元 素 的 起 始 地 址 。 
如 果 下 标 从 0 开始 ， 则 第 i 个 元 素 之 前 就 有 i 个 元 素 ， 此 时 上 面 的 公式 就 变 为 : 


loc(aiFloc(al)}t i*ec 


由 此 可 狗 ， 求 数组 中 数据 元 素 的 地 址 ， 已 知 条 件 必须 是 知道 第 一 个 元 素 的 地 址 ， 然 后 主 
要 是 找 出 该 元 素 之 前 已 经 存储 了 多 少 个 数据 元 素 。 在 一 维 数组 中 ， 只 要 知道 任何 一 个 元 素 的 
地 址 即 可 求 出 其 他 元 素 的 地 址 ， 但 在 多 维 数 组 中 ， 己 知 条 件 必须 是 第 一 个 数据 元 素 地 址 。 


2. 多 维 数组 


以 一 维 数组 的 顺序 存储 为 例 说 明 ， 二 维 数 组 在 顺序 存储 时 一 般 有 两 种 。 : 

(1) 行 优先 顺序 : 存储 时 先 按 行 从 小 到 大 的 顺序 存储 , 在 每 一 行 中 按 列 号 从 小 到 大 存储 。 

(2) 列 优先 顺序 : 存储 时 先 按 列 从 小 到 大 的 顺序 存储 , 在 每 一 列 中 按 行 号 从 小 到 大 存储 。 

以 上 的 两 种 存储 顺序 中 ， 第 一 个 被 存放 的 元 素 总 是 第 一 行 第 一 列 的 数据 元 素 ， 所 以 该 
元 率 的 地 址 是 我 们 的 已 知 条 件 。 : z 

同样 在 二 维 数 组 中 比较 典型 的 是 计算 数据 的 存储 位 置 。 
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假设 二 维 数组 是 m*n 的 二 维 数组 (共有 m 行 ， 每 行 有 n 列 )。 第 一 个 数据 元 素 的 地 址 是 
loc(ai1)， 则 第 i 行 第 j 列 的 数据 元 素 的 地 址 的 计算 公式 应 为 (按照 行 优先 顺序 存储 ): 


loc(a;)=loc(ai)+t[(i - 1)*nti ~ lJ*e 


假设 下 标 从 1 开始， 我们 需要 计算 出 i 行 前 面 已 经 存储 了 i- 1 行 元 素 ， 每 行 有 nn 个 元 
素 , 共有 (i - 1)*n 个 数据 元 素 , 在 第 i 行 元 素 中 , j 列 之 前 有 j- 1 个 数据 元 素 , 共有 (i-1)*ntj 
-1 工 个 元 素 ， 每 个 元 素 扣 有 ec 个 存储 单元 ， 上 只 要 乘 以 c 就 可 以 列 出 地 址 。 其 中 loc(ay) 表 示 
第 i 行 第 7 列 数 据 元 素 的 内 存 的 起 始 位 置 ，loc(al1) 表 示 第 一 个 数据 元 素 的 内 存 位 置 ，c 表 
示 每 个 数据 元 素 所 占有 的 内 存 空间 的 大 小 ， 如 果 下 标 从 0 开始 ， 只 要 不 用 减 1 即 可 。 

如 果 按 列 优先 顺序 存储 ， 则 地 址 的 计算 为 : 


loc(ay}=loc(aun)+t{G ~ 1)*mti~ 1]*c 


假设 下 标 从 1 开始 , 其 中 loc(ay) 表 示 第 i 行 第 j 列 的 数据 元 素 的 内 存 起 始 位 置 ， loc(ali) 
表示 第 一 个 数据 元 素 的 内 存 位 置 ，c。 表示 每 个 数据 元 素 所 占有 的 内 存 空 间 的 大 小 。 主 要 还 
是 计算 第 i 行 第 j 列 元 素 之 前 有 多 少 个 数据 元 素 。 如 果 下 标 从 0 开始 ， 只 要 不 用 减 1 即 可 。 

按 此 公式 可 以 推广 到 多 维 数组 的 数据 元 素 的 地 址 计算 (假设 按照 行 优先 顺序 存储 ): 

m 行 n 列 纵 标 为 的 三 维 数 组 ， 假 设 第 一 个 元 素 的 地 址 是 loc(a111)， 如 果 按 行 优先 顺 
序 存 储 ，i 行列 纵 标 为 p 的 数据 元 素 的 地 址 为 (可 以 将 它 分 解 为 二 维 数组 ): 


loc(aip)=Ioc(arn)t{Gi ~ 1)*n*ktG - 1)*k+p- ]]*#c 
如 果 下 标 从 0 开始 ， 只 要 不 用 减 1 即 可 。 
读者 可 以 从 以 上 的 地 址 公式 中 找 出 一 定 的 地 址 计算 规律 .多维 数组 中 按 行 优先 计算 公 
式 用 一 个 下 标 乘 以 后 面 的 最 大 值 。 
例如 四 维 数组 m*#mnxkzxzl 中 ， 地 址 的 公式 为 : 


loc(aypa)=loc(an ut [Gi — Drntpsit(G — Ts 人 有 Hp - DJ*iHo ~ 1]*c 


如 果 下 标 从 0 开始 ， 只 要 不 用 减 1 即 可 。 
下 面 以 二 维 数组 为 例 说 明 多 维 数 组 的 基本 操作 。 


4.1.3 ”显示 二 维 数 组 的 内 容 


假设 二 维 数组 以 行为 主 序 存储 ， 将 它 转 换 为 按 列 为 主 序 的 存储 算法 。 


public class arrayzhuan 
{ / / 
pubilc static void main (string args[ ]) 

{int [ ] [ ] data={ {9,7,6,6},{3,5,3,3},{6,6,4,7},{7,5,1,4)},{1,2,8,0}}; /定义 二 维 数组 
int rowdata[]=new int[20] /用 来 存储 以 行为 主 序 的 上 述 二 维 数组 
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int coldata[]= new int [20] /用 来 存储 以 列 为 主 序 的 上 述 二 维 数组 
int 1,]; 
system.out.printin(“ 输 出 二 维 数组 ”); 
for (1=0;1<5$;1++) 
{ 
for (J=0;j<4;]++) 
system.out.print(" "+data[i][j]+" "): 
system.Out.println(™'); 
for (i=0;i<5;it+) 1// 转 换 为 以 行为 主 序 的 一 维 数组 
for (J=0;j<4;j++) 
rowdatafi*4+jj=Data[i]Dj]; 
System.out.println(”); 
System.out.println( the rowmajor matriXx:”); 
for (i=0;i<20;i++) // 输 出 以 行为 主 序 的 数组 的 值 
system.Out.print(" "+rowdatafi]}+" "); 
system.out.println("""); 
for (i=0;i<5;it+) /转换 以 列 为 主 序 的 一 维 数 组 
for (=0;j<4:]++) 
coldata[j*5+i]=datafi][j]; 
system.out.printin(™™); 
for (i=0;i<20;i++) // 输 出 以 列 为 主 序 的 数组 的 值 
system.out.print(" "+Coldata[l]+" "); 
system.out.printin("™"); 
4 
} 


一 般 情况 下 ， 只 要 定义 了 数组 的 存储 顺序 ， 数 组 的 存储 顺序 就 不 会 改变 了 ， 所 以 对 数 
组 的 各 种 操作 后 ， 应 按照 数组 的 已 定义 的 存储 顺序 存储 。 也 就 是 说 ， 如 果 是 按 行 优先 顺序 
存储， 在 对 数组 操作 后 ， 即 使 改变 了 存储 顺序 ， 也 应 改变 按照 行 优先 顺序 存储 。 


4.2 ”十 阵 的 人 存储 


4.2.1 和 矩 阵 的 压缩 存储 


所 袁 滤 隆 的 压缩 行 储 ， 也 就 是 在 存储 数组 时 ， 尽 量 减少 存储 空间 ， 但 是 数组 中 的 每 个 
元 系 上 必须 存储 ， 所 以 在 矩阵 存储 中 ， 如 果 有 规律 可 寻 ， 只 要 存储 其 中 一 部 分 ， 而 另 一 部 分 
的 存储 地 址 可 以 通过 相应 的 算法 将 它 计算 出 来 ， 从 而 占有 比较 少 的 存储 空间 达到 存储 整个 
窍 阵 的 目的 。 
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矩阵 的 压缩 存储 仅 是 针对 特殊 算 阵 的 ， 而 对 于 没有 规律 可 循 的 二 维 数组 则 不 能 够 使 用 
矩阵 压缩 存储 。 

二 维 数组 (矩阵 ) 的 压 盎 存储 一 般 有 3 种 ， 它 们 分 别 是 对 称 和 矩阵 、 黎 玻 和 矩阵 和 三 角 窍 阵 。 
3 种 算 阵 中 以 黎 玻 矩阵 比较 利 见 。 


1. 对 称 矩 阵 
大 n 阶 滤 阵 A 中 的 元 素 满 足以 下 条 件 : 
Gy Aji i 之 1， 7 二 1 


则 称 为 于 阶 对称 和 矩阵 。 

对 于 对 称 矩 阵 ， 如 果 不 采 用 压缩 存储 ， 占 有 的 存储 单元 有 六 个 ， 因 为 是 对 称 矩 阵 ， 所 
以 只 要 存储 对 角 的 数据 元 素 和 一 半 的 数据 元 素 即 可 , 占有 的 存储 单元 有 n(n - 1)/2 个 。 如 果 
以 行 序 为 主 序 存储 其 下 三 角 (包括 对 角 线 ) 的 元 素 ， 其 上 三 角 的 元 素 可 以 推算 出 来 。 

如 果 用 一 维 数组 存储 一 个 对 称 窍 阵 ， 只 要 将 对 称 和 矩阵 存储 在 一 个 最 大 下 标 为 n(n - 1)/2 
的 一 维 数组 $ 中 即 可 。 此 时 按照 行 优先 顺序 存储 ， 数 据 元 素 a; 与 数组 $ 的 下 标 大 的 对 应 关 
系 为 : 


ij- 1X2 + 当 i 之 } 时 
- | 
Jr- 2+i 当 i 过 7 时 


对 于 任意 给 定 的 一 组 下 标 (iy)， 均 可 在 S 中 找到 元 素 ay， 反 之 ， 对 所 有 元 素 都 能 够 确 
定 在 S 中 位 置 ， 当 ;< 时， 根据 对 称 和 矩阵 的 性 质 推算 即 可 。 由 此 可 以 看 出 ， 对 称 和 矩阵 的 存 
储 可 以 使 用 一 维 数组 S$， 占用 的 空间 不 再 是 nw， 而 是 n(n - 1Y2， 空 间 减 少 了 接近 一 半 ， 实 
现 了 二 维 数 组 的 压缩 存储 。 

所 博 对 角 趣 阵 ， 也 就 是 指 矩 阵 的 所 有 非 零 元素 都 集中 在 以 主 对 角 线 为 中 心 的 带 状 区 域 
中 ， 即 除了 主 对 角 线 上 和 直接 在 主 对 角 线 上 、 下 方 若干 条 对 角 线 上 的 元 素 之 外 ， 其 余 元 素 

下 面 给 出 一 个 对 角 和 矩阵 的 例子 (三 对 角 和 矩阵 ): 


bi! bi2 
021 b22 b23 
b3> b33 ba4 
B ee 和 和 和 
~ 六 
b jl b nn 


也 可 以 按照 茶 个 原则 (或 者 以 行 序 为 主 序 ， 或 者 以 列 序 为 主 序 ， 或 者 按 对 角 线 的 顺序 ) 
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将 对 角 和 窍 阵 B 的 所 有 非 零 元 素 压 缩 存储 到 一 个 一 维 数组 LTB[1……3n-2] 中 。 这 里 不 妨 仍然 
以 行 序 为 主 序 的 原则 对 B 进行 压缩 存储 ， 当 B 中 任 一 非 零 元 素 b; 与 LTB[4] 之 间 存 在 着 如 


=2*itj ~ 2 


时 ， 则 有 5;=LTB[K1。 称 LTB[1……3n - 2] 为 对 角 和 矩阵 B 的 压缩 存储 。 

上 面 讨 论 的 几 种 特殊 矩阵 中 ， 非 零 元 素 的 分 布 都 具有 明显 的 规律 ， 因 而 都 可 以 被 压缩 
存储 到 一 个 一 维 数 组 中 ， 并 能 够 确定 这 些 和 矩阵 的 每 个 非 零 元 素 在 一 维 数组 中 的 存储 位 置 。 
但 是 ， 对 于 那些 非 零 元 素 在 窍 阵 中 的 分 布 没 有 规律 的 特殊 矩阵 (如 稀 玖 矩阵 )， 则 需要 寻求 
其 他 方法 来 解决 压缩 存储 问题 。 


2. 稀 蚊 和 矩阵 


对 稀 朴 矩阵 很 难 下 一 个 确切 的 定义 ， 它 只 是 一 个 任 人 们 的 直觉 来 理解 的 概念 。 一 般 认 
为 ， 一 个 较 大 的 矩阵 中 ， 零 元 素 的 个 数 相 对 于 整个 矩阵 元 素 的 总 个 数 所 占 比 例 较 大 时 ， 该 
矩阵 就 是 一 个 稀疏 矩阵 。 例 如 ， 有 一 个 6X6 阶 的 矩阵 A， 其 36 个 元 素 中 只 有 8 个 非 零 元 
素 ， 那 么 ， 可 以 称 和 矩阵 A 为 稀疏 矩阵 。 

稀 朴 矩阵 一 般 是 指 矩阵 中 的 大 部 分 元 素 为 零 ， 仅 有 少量 元 素 非 零 的 矩阵 ， 或 者 说 矩阵 
A(mXn) 中 有 S 个 非 零 元 素 ， 如 果 8 远 远 小 于 矩阵 的 元 素 总 数 ， 则 称 A 为 稀 政和 矩阵。 稀疏 
矩阵 的 存储 一 般 只 要 保存 非 零 元 素 即 可 ， 对 于 零 元 素 可 以 不 予 保存 ， 这 样 就 可 以 实现 稀 政 
矩阵 的 压缩 存储 。 可 | 

稀 朴 矩阵 的 压缩 存储 采用 三 元 组 的 方法 实现 。 其 存储 规则 是 每 一 个 非 零 元 素 占有 一 
行 ， 每 行 中 包含 非 零 元 素 所 在 的 行 号 、 列 号 、 非 零 元 素 的 数值 。 为 完整 描述 稀 朴 矩阵 ， 一 
般 在 第 一 行 描述 矩阵 的 行 数 、 列 数 和 非 零 元 素 的 个 数 。 其 逻辑 描述 为 ; 


(row col value) 


其 中 row 表示 行 号 ，col 表示 列 号 ，value 表示 非 零 元 素 的 值 。 
如 果 每 个 非 零 元 素 按照 此 种 方法 存储 ， 虽 然 能 够 完整 地 描述 非 零 元 素 ， 但 如 果 矩 阵 中 
有 整 行 (或 整 列 ) 中 没有 非 零 元 素 ， 此 时 可 能 不 能 够 还 原 成 原来 的 矩阵 。 所 以 为 了 完整 地 描 
述 稀 朴 矩阵 ， 在 以 上 描述 的 情况 下 ， 如 果 增 加 一 行 的 内 容 ， 该 行 包 括 矩 阵 的 总 的 行 数 、 抵 
阵 的 总 的 列 数 、 和 矩阵 中 非 零 元 素 的 个 数 ， 就 可 以 还 原 为 原来 的 和 矩阵 描述 了 。 
例如 ， 稀 疏 矩 阵 为 : 


U00000 0 
03000 0 
1] 4 0 0 0 0 
00900 0 
0.0 0 00 0 


该 矩阵 是 一 个 5X6 阶 和 矩阵 ， 如 果 一 个 元 素 占 有 1 个 存储 单元 ， 应 该 占有 30 个 存储 单 
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元 ， 如 果 使 用 三 元 组 存储 ， 则 应 该 写 为 : 


3 0 14 
2 2 3 
3 1 1 
3 2 4 
4 3 9 


第 一 行 按 列 号 依次 描述 的 是 : 失 阵 共有 5$ 行 6 列 4 个 非 零 元 素 。 

从 第 二 行 开 始 每 列 依次 描述 的 含义 是 : 非 零 元 素 所 在 的 行 号 、 列 号 和 非 零 元 素 的 值 。 

所 占 的 空间 是 5X3=15 个 存储 单元 。 

归纳 起 来 ， 若 一 个 稀疏 矩阵 有 上 个 非 零 元 素 ， 则 需要 用 t+1 行 的 三 元 组 来 表示 黎 玖 矩 
阵 。 到 底 矩 阵 何 时 使 用 三 元 组 存储 呢 ? 一 般 对 mXn 的 窍 阵 来 说 ， 只 要 满足 (村 1)*3 委 六 本 
这 个 条 件 ， 使 用 三 元 组 存储 可 以 节省 空间 ， 否 则 更 加 浪费 空间 ， 也 就 没有 必要 使 用 二 元 组 
存储 ， 所 以 稀 朴 矩阵 中 的 非 零 元 素 的 个 数 上 是 能 否 使 用 三 元 组 存储 的 关键 。 


4.2.2” 稀 朴 矩阵 转换 为 三 元 组 存储 


矩阵 的 存储 规则 一 般 有 两 种 ， 按 行 优先 顺序 存储 和 按 列 优先 顺序 存储 。 所 谓 按 行 优先 
顺序 存储 是 指 在 存储 过 程 中 ， 按 照 行 号 从 小 到 大 存储 ， 行 号 相同 时 ， 按 照 列 号 从 小 到 大 顺 
序 存储 。 所 谓 按 列 优先 顺序 存储 是 指 在 存储 过 程 中 ,按照 列 号 从 小 到 大 存储 ， 列 号 相同 时 ， 
按照 行 号 从 小 到 大 顺序 存储 。 一 般 我 们 选择 按 行 号 优先 顺序 存储 的 较 多 。 通 常 在 确定 了 存 
储 规 则 之 后 ， 无 论 对 矩阵 进行 什么 样 的 操作 ， 规 则 应 该 不 变 。 也 就 是 说 ， 当 所 阵 按 行 号 优 
先 顺序 存储 时 ， 如 果 将 矩阵 转 置 后 ， 变 成 按 列 优先 顺序 存储 ， 此 时 仍然 需要 将 此 矩阵 转换 
为 按 行 号 优先 顺序 存储 。 
首先 应 该 将 稀疏 矩阵 转换 为 三 元 组 存储 ， 然 后 再 利用 三 元 组 的 存储 ， 实 现 对 矩阵 的 各 
种 运算 。 
将 一 个 具体 的 稀疏 矩阵 转换 为 三 元 组 存储 的 算法 为 : 
public class arrayl 
{ 


public static void main (string args[}]) 


{ 


int [j[]data=; {0 000 0 0 
{03000 0), 
{0 40 0 0 0 
{0 09 0 0 0) 


{0 0 0 0 0 0}}; W 假 设 一 个 5x6 阶 矩阵 
int comparessdata[]f]=new int [10]f3]; ”WU 假 设 一 个 10X3 的 三 元 组 容 间 
int index: // 三 元 组 的 行 写 
int 1,]; 
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index=0; 
for (i=0;i<S:; 计 十 ) /输出 矩阵 中 的 所 有 元 素 
for (J=0:]<6;j++) 
system.out.print(" "+data[ijj]+ "” "): 
system.out.pPrintin(” 
} 
for (1=0,1<5;it++) 
for =0;]<6:j++) 
if datafi]{j}]!=0 


{ Index+ 十 ; 
compressdata[index][0]=i: // 非 零 元 素 的 行 号 
compressdata[index][1]=j: / 非 零 元 素 的 列 号 
compressdata[index]j[2]=datafijfj]j W 非 零 元 素 的 值 
} 
comapressdata[0j[0]=5; /给 三 元 组 的 第 0 行 赋值 


compressdataf0][1]=6; 
compressdata[0][2]=index: 
for (i=0;i<=index;i++) // 输 出 三 元 组 的 所 有 元 素 
+{ 
for (J=0;j<3:j++) 
system.out.print(""+compressdata[i]lj]+ " "); 
system.out.printin(""); 


} 


} 


对 于 答 阵 的 运算 一 般 有 和 矩阵 的 转 置 ， 在 转 置 时 值得 注意 的 是 :在 矩阵 的 存储 规则 已 经 
确定 的 情况 下 (如 按 行 优先 存储 ), 实现 矩阵 的 运算 (如 转 置 ) 时 , 应 仍然 保留 原来 的 存储 规则 。 

假设 compressdata[][] 中 存储 着 一 个 行 优 先 的 三 元 组 ， 共 有 5 行 6 列 ，index 个 非 零 元 
素 ， 将 它 转 置 后 存储 在 compressdatal[][] 中 ， 并 仍然 以 三 元 组 存储 并 按 行 优先 存储 。 


public class transarrayl 


| 
public static void main (string args[]) 
int compressdatal[][]=new int [10][3]j; V 假设 一 个 10X3 的 三 元 组 空间 
int index， /二 元 组 的 行 号 
int 1,]; 
compressdatal[0][0]=compressdatal {0][1]: /给 三 元 组 的 第 0 行 赋值 


compressdatal[0][1}= compressdatal[0][0]; 
compressdatal[0][2]j=index， 
int n=compressdata[0][1]; 
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int m=1; 
for (i=1;i<=n;it+) /检查 所 有 非 零 元 素 的 列 号 并 实现 转 置 
| 
for 0=1;]j<=index;j++) 
《 
if (compressdatal[]j]l{1|]==i) 
{compressdatal[m][0l=compressdata[j}[1]; 
compressdatal1[mj[1j=compressdatafj] TO]; 
compressdatal[mj| 2]=compressdata[]][2]; 
m+t+; } 
for (i=0;,i<=index;it++) /打印 转 置 后 的 三 元 组 
{ z 
for (j=0;<3:++) / 
system.out.print(""+compressdatal [1]Dj}+ " "); 
system.out.printlIn(""); 


yy- 
} 


打印 的 结果 仍然 是 按 行 优先 顺序 存储 ， 但 这 种 转 置 方 法 有 很 多 的 重复 运算 ， 例 如 对 已 
经 转 置 过 的 非 零 元 素 ， 仍 需要 扫 找 ， 对 没有 非 零 元 素 的 行 也 需要 扫描 ， 其 时 间 复 杂 度 是 
O(n*f)， 可 见 算法 的 效率 不 高 。 为 了 提高 算法 的 效率 ， 可 以 对 该 算法 加 以 改进 ， 实 现 三 元 
组 的 快速 转 置 。 | 

改进 的 转 置 方 法 可 以 利用 对 原始 的 三 元 组 的 元 素 的 扫描 ， 直 接 确 定 该 元 素 在 转 置 后 的 
三 元 组 中 的 行 ， 这 样 可 以 将 原始 三 元 组 中 的 元 素 直 接 放 在 转 置 后 的 三 元 组 中 即 可 。 这 种 方 
法 需要 增加 两 个 一 维 数组 的 结构 开销 。 

假设 两 个 数组 num[] 和 pos[]， 其 中 num[ 引 表示 在 compressdata[] 站 中 列 号 为 i 的 非 零 元 
素 个 数 ，pos[] 表 示 在 compressdata[][] 中 列 号 为 i 的 第 一 个 非 零 元 素 转 置 后 放 在 
compressdatalf][] 中 的 行 号 。 规 定 : 


pos[1]=] 
此 时 不 难看 出 pos 轩 之 间 存 在 以 下 的 关系 : 
pos[i]=pos[i - 1]+num[i ~ 1] i 之 2 


在 整个 算法 的 实现 中 ， 计 算出 每 一 个 pos[i]， 然 后 对 compressdata[][] 中 所 有 元 素 扫 描 ， 
直接 将 数据 元 素 放 在 compressdatal[][] 中 即 可 。 


public class transarray2 
t 
public static void main (String args[{]) 
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int comparessdatai[f]fj=new int [10][3]， /假设 一 个 10X3 的 三 元 组 空间 


int pos=new int[10]: /假设 有 10 个 非 零 元 素 

int num=new int{ 10}; 

int index:; // 三 元 组 的 行 号 

int jj; 

Compressdatal [0][0]=compressdatal [OJ{1]: /给 三 元 组 的 第 0 行 赋值 


Compressdatal[0][1]= compressdatal[0]{0]; 
Compressdatal {0112}]=index; 
Int n=compressdata[0}[1]; 


int m=1; 
for (j=0:j<n:j++) “VW 给 numf] 赋 初 值 
{ num[1]=0;} 

pos[1]j=1; 

for (i=1;1<=index;i++) /计算 numf] 的 值 

{num[compressdatalil[1l1l++;} 

for (i=2;i<=n;i++) /计算 pos[] 的 值 

poslH=posll-11+num[i-l]; 
for (i=1;i<=index;i++) - /直接 转 置 


compressdatal[posLcompressdata[i][1]][0]=compressdatafij[1]; 
compressdatal[pos[compressdata[i]{1]]}[1]=compressdatafi}[0}; 
compressdatal[pos{compressdata[l][1]]][2]=compressdata[i}[2]; 
poslcompressdatafij{1]}++; } 
for (ij=0;i<=index;i++) /打印 转 置 后 的 三 元 组 
t 
for (J=0;]<3;]++) 
system.out.print(""+compressdatal li][D+ " "); 
system.out.println(™""); 


} 


} 


快速 转 置 算法 的 时 间 复 杂 度 为 O(n+j。 相 对 前 面 的 转 置 算法 ， 算 法 的 效率 明显 提高 了 
很 多 ， 但 同时 增加 了 空间 的 开销 。 
稀疏 矩阵 的 基本 运算 有 很 多 ， 例 如 矩阵 的 乘法 等 ， 在 此 就 不 再 叙述 了 ， 请 读者 自己 

值得 注意 的 是 : 辣 量 (Vector) 就 是 数字 的 一 个 有 穷 序 列 ， 从 几何 上 看 ,可 以 把 二 维 向 量 
(x 看 成 平面 中 的 一 个 点 ; 而 三 维 向 量 (x,y,z) 表 示 三 维 空间 中 的 一 个 点 。 在 线性 代数 中 ， 可 
以 经 常见 到 n 个 元 素 的 同 量 (x1,x2,x3,…,xn)， 并 使 用 下 标 来 表示 菜 个 元 素 。 

在 Java 中 ， 除 以 下 两 点 以 外 ， 向 量 与 数组 完全 相同 : 

e 一 个 向 量 是 类 java.util.Vector 的 实例 

e 一 个 向 量 的 长 度 可 以 改变 。 
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43 广义 表 


4.3.1 广义 表 的 定义 


广义 表 是 线性 表 的 扩展 ,具体 定义 为 xz 过 0) 个 元 素 的 有 限 集合 。 其 中 元 素 有 以 下 两 种 
类 型 : 

e 一 个 原子 元 素 ( 指 不 可 再 分 的 元 素 ) 

e 一 个 可 以 再 分 的 元 素 (或 称 为 一 个 子 表 ) 

如 果 所 有 元 素 都 是 原子 元 素 ， 则 称 为 线性 表 ， 如 果 含 有 子 表 ， 则 是 广义 表 。n 的 值 是 
广义 表 的 长 度 ， 如 果 n=0， 称 广义 表 为 空 表 。 


广义 表 的 基本 操作 为 : 
initGlist(&L) // 创 建 空 的 广义 表 
creatGlist(&L,S) /由 $ 创建 广义 表 上 L 
destroyGlist(&L) /销毁 广义 表 寺 
Glistlength(L) // 求 广义 表 的 长 度 
Glistdepth(L) / // 求 广义 表 的 深度 
Gethead(L) ”1// 求 广义 表 L 的 头 
Gettail(L) // 求 广义 表 的 表 尾 
Insertfirst Glist(&L,e) // 插 入 元 紊 e 作为 广义 表 工 的 第 一 个 元 素 
Deletefirst Glist(&L,é&e) /1 删除 广义 表 上 的 第 一 个 元 素 ， 并 用 e 返回 其 值 
三 义 表 一 般 记 作 : 
LS=(al dy, an) 
其 中 LS 是 广义 表 的 名 称 ，n 是 广义 表 的 长 度 。 
常见 的 广义 表 为 : 
A=() 
B=(()) 
C=(a,b) 
D=(4,B,C) 
E=(a,E) 


广义 表 中 含有 元 素 的 个 数 称 为 广义 表 的 长 度 ， 广 义 表 中 含有 的 括号 对 数 称 为 广义 表 的 
深度 。 
从 上 述 定义 和 例子 可 推出 列表 的 3 个 重要 结论 : 

(1) 列表 的 元 素 可 以 是 子 表 ， 而 子 表 的 元 素 还 可 以 是 子 子 表 …… 由 此 ， 列 表 是 一 个 多 


层次 的 结构 ， 可 以 用 图 形象 地 表示 。 例 如 图 4-1 表示 的 是 列表 D。 其 中 以 圆圈 表示 列表 ， 
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纪 方 块 表示 原子 元 素 。 
© 
(3) Ue 
| 2 


os 
”图 4-1 列表 的 图 形 表示 

(2) 列表 可 为 其 他 列表 所 共 圣 。 例 如 在 上 述 例子 中 ， 列 表 4、B 和 C 为 DD 的 子 表 ， 则 
在 D 中 可 以 不 必 列 出 子 表 的 仁 ， 而 是 通过 子 表 的 名 称 来 引用 。 

(3) 列表 可 以 是 一 个 囊 归 的 表 ， 即 列表 也 可 以 是 其 本 号 的 一 个 子 表 。 例 如 ， 列 表 E 味 
是 一 个 递归 的 表 。 

上 义 表 的 表 头 是 广义 表 中 的 第 一 个 元 素 ， 而 表 尾 则 是 去 掉 表 头 之 后 的 所 有 元 素 ， 在 广 
义 表 中 通常 利用 求 表 头 和 表 尾 运算 求 得 广义 表 中 某 个 元 素 的 值 。 


4.3.2 ”广义 表 的 存储 


广义 表 的 存储 方法 有 很 多 种 ， 一 般 采 用 链表 存储 。 采 用 链表 存储 时 的 结 点 存储 的 逻辑 


结构 如 图 4-2 所 示 。 


图 4-2 上 三 义 表 的 逻辑 结构 图 


其 中 flag 表示 标志 位 ， 当 flag 为 0 时 ， 该 结 点 表示 原子 元 素 ， 当 flag 为 1 时 ， 该 结 点 
表示 子 表 ; 当 flag 为 0 时 ，info 表示 原子 元 素 的 值 ， 当 flag 为 1 时 ，info 表示 指针 ， 指 向 
该 子 表 的 第 一 个 结 点 ; link 表示 指针 ， 指 疝 广 义 表 的 下 一 个 元 素 。 

例如 广义 表 4=(a,(5,(c)),(q,e), 有 jj， 利用 链表 存储 ， 其 逻辑 图 如 图 4-3 所 示 。 


人 ol 
DUE EN 
oe 


图 4-3 厂 义 表 的 链 式 存储 结构 图 
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厂 义 表 可 以 采用 多 种 方式 实现 ， 最 简单 的 方法 是 使 用 数组 实现 ， 这 对 具有 定 长 元 素 的 
链 可 以 工作 得 很 好 ， 而 对 具有 变 长 元 素 的 链 ， 可 以 把 子 表 看 成 变 长 元 素 ， 如 果 要 使 用 这 种 
方法 ， 需 要 每 个 子 表 的 一 些 开始 和 结束 标识 。 因 为 纯 表 等 价 于 树 ， 对 于 纯 表 可 以 使 用 链接 
分 配 的 方法 文 持 对 表 的 子女 的 访问 ， 需 要 附加 标识 符 用 来 区 别 结 点 是 原子 还 是 子 表 。 另 一 
种 方法 是 使 用 两 个 存储 指针 字段 的 链 结 点 表示 所 有 元 素 ， 除 了 原子 以 外 ， 它 只 包含 数据 ， 
指针 可 能 包含 一 个 标记 位 ， 来 标识 它 指 向 什么 ， 被 指向 的 对 象 也 可 能 存储 一 个 标记 位 ， 来 
标识 目 己 ， 标 记 把 原子 和 表 结 点 区 分 开 ， 这 种 实现 可 以 方便 地 支持 可 重 入 表 和 循环 表 ， 因 
为 一 个 络 点 的 指针 可 能 指向 任何 其 他 结 点 。 


思考 和 练习 


1. 基础 知识 题 


(1) 是 否 可 以 将 多 个 不 同 数 据 类 型 的 数据 存储 于 同一 个 数组 中 ? 
(2) 如 果 声 明 一 个 大 小 为 20 的 整数 数组 ， 是 否 一 定 要 在 数组 中 存 满 20 个 元 素 ? 
(3) 以 行为 主 序 和 以 列 为 主 序 说 明 数 组 的 表示 法 。 
(4) 若 使 用 以 行为 主 序 的 数组 表示 法 是 否 比 以 列 为 主 序 的 数组 表示 法 要 节省 空间 ? 
(5) 判断 ， 在 Java 语言 中 声明 一 个 数组 为 Int Data[]=new int[20]: 则 其 可 使 用 的 空间 为 
Datat[1]~Dataf20]. 
(6) 下 列 说 法 哪个 是 不 正确 的 ? 
(a) 每 一 个 数组 ， 缘 有 一 个 下 标 和 一 个 元 素 值 
(b) 下 标 是 用 来 方便 存 取 数据 
(c) 元 素 值 正 是 被 存储 数据 的 位 置 
(d) Java 中 的 数组 下 标 从 0 开始 
(7) 下 列 哪 一 个 是 声明 一 个 大 小 为 30 的 字符 数组 的 正确 方法 ? 
(a) char Data[29] 
(b) char Dataf30] 
(c) char Data[31 
(d) 以 上 皆 非 
(8) 者 有 一 个 整数 数组 x 是 采用 以 行为 主 序 的 表示 法 ， 已 知 其 x[3,5] 的 地 址 为 1000， 
x[5,7] 的 地 址 为 1200， 则 下 列 说 法 哪 一 个 是 不 正确 的 ? 
(a) 行 的 个 数 为 49 
(b) x[8,10] 的 地 址 为 1600 
(c) x[3,8] 的 地 址 为 1016 
(d) 整数 数组 每 一 个 元 素 占 2 个 字 节 
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(9) 在 一 个 长 度 为 nx， 包 含 m 个 原子 元 素 的 广义 表 中 ， 
(a)m 和 n 相等 (b)m 不 大 于 nn (0) 黄 不 小 于 n (dd)m 与 n 无 关 
(10) 广义 表 的 元 素 分 为 


(a) 原子 元 系 (b) 表 元 素 (c) 原子 元 素 和 表 元 素 ”(d) 任意 元 素 
(11) 三 义 表 4=(0,(@),(b,(c,q))) 的 长 度 为 
(a) 2 (b) 3 (c) 4 (d) 5 


2. 应 用 题 


(1) 话说 明 何 博 “ 藤 态 和 内存 配置 ”， 其 优 、 缺 点 各 是 什么 。 
(2) 大 声明 一 个 浮 点 数 数 组 如 下 : 


float Average 上 =new float[30]; 


假设 读数 组 的 内 存 起 始 位 置 为 200， 试 求 Average[1$1 和 Average[27] 的 内 存 地 址 。 
(3) 试 利 用 Java 语言 写 出 在 数组 中 插入 元 素 和 删除 元 素 的 子 程 序 。 

(4) 试 说 明 何 请 以 行为 主 序 和 以 列 为 主 序 。 

(5) 试 利 用 以 行为 主 序 的 方法 来 说 明 数 组 在 内 存 中 的 存储 方式 。 


9 7 Ss 0 1 
3 5 4 6 8 
] 8 2 3 4 
3 0 7 1 8 
9 Ss 1 8 6 


(6) 在 有 一 个 二 维 数组 Data， 排 列 方式 为 : Data[3][ 引 ] 的 内 存 地 址 为 3000，Data[4][6] 
的 内 存 地 址 为 3600， 试 求 Data[5][7] 的 内 存 地 址 。 

(7) 假设 一 个 浮 点 数 二 维 数 组 共有 7 行 9 列 ， 数 据 存 储 方式 采用 以 行为 主 序 ， 且 在 内 
人 存 上 的 起 始 地 址 是 300， 试 求 出 数组 中 第 6 行 第 5 列 的 元 素 在 内 存 中 的 地 址 。 

(8) 试 求 出 稀疏 数组 


00108 0 
0 000 0 0 
0 .4030 0 
6 000 0 0 
00 0 0 0 0 
0 5 0 .000 
00000 0 


压缩 后 的 数组 内 容 。 

(9) 大 有 一 个 大 小 为 5x5 的 上 三 角 数 组 ， 试 求 出 数组 [3,4] 这 个 元 素 在 以 行为 主 序 和 以 
列 为 主 序 两 种 方式 转换 后 的 一 维 数 组 的 下 标 。 

(10) 给 定 稀 玖 矩阵 的 存储 表示 后 ， 实 现 以 下 操作 : 


。 9094 。 
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在 给 定位 置 问 窍 阵 择 入 一 个 元 素 
从 矩阵 的 给 定位 置 删除 一 个 元 素 
习 索 矩阵 中 给 定位 置 的 元 素 

对 一 个 矩阵 进行 转 置 
两 个 矩阵 相 加 
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树 (tree) 型 结构 是 一 类 重要 的 非 线性 结构 。 树 型 结构 反映 了 数据 元 素 之 间 的 层次 关系 和 
分 支 天 系 ， 非 党 类 似 于 目 然 界 中 的 树 。 树 型 结构 在 现实 生活 中 广泛 存在 ， 如 企业 的 组 织 结 
构图 等 。 男 外 ， 在 计算 机 科学 中 亦 具有 厂 泛 的 应 用 ， 如 编译 程序 中 源 程序 的 语法 结构 就 是 
用 树 型 结构 来 表示 的 ， 数 据 库 系统 中 也 采用 树 型 结构 组 织 信息 。 


本 曹 的 学 习 上 月 标 : 

树 以 及 二 又 树 的 概念 、 性 质 、 存 储 结构 和 遍历 算法 ， 
一 般 树 和 二 又 树 的 转换 关系 ; 

线索 二 又 树 、 哈 夫 曼 树 等 典型 树 型 结构 的 应 用 : 
通过 二 又 树 的 定义 了 解数 据 之 间 的 层次 关系 ; 

在 掌握 二 又 树 的 过 有 历 方法 后 ， 萤 握 线索 二 又 树 ; 

了 解 险 夫 曼 树 的 应 用 和 哈 夫 曼 编码 。 


5.1 树 的 概念 


本 节 主 要 讲述 树 的 定义 ; 树 的 常用 表示 方式 ， 邵 树 型 表示 法 、 文 氏 图 表示 法 、 冲 入 图 
表示 法 以 及 三 义 表 表示 法 ， 度 、 路 径 、 结 点 的 层 数 等 树 的 基本 术语 。 


5.1.1 树 的 定义 


树 是 一 种 数据 结构 ， 表 示 为 TREE=(D,R);。 

其 中 ，D 是 具有 相同 特性 的 数据 元 素 的 集合 R 是 元 素 集 合 D 上 的 关系 集合 ， 如 果 记 
中 只 含有 一 个 数据 元 素 ， 则 尽 为 空 集 。 

或 者 用 递归 定义 为 : 树 是 NOV>0) 个 结 点 的 有 限 集合 。 其 惟一 关系 具有 下 列 属性 : 集合 
中 存在 惟一 的 一 个 结 点 ， 称 为 树 根 ， 该 结 点 没有 前 趋 ， 除 根 结 点 外 ， 其 余 结 点 分 为 MM 二 
0) 个 互 不 相交 的 集合 ， 其 中 每 一 个 集合 都 是 一 棵 树 ， 并 称 其 为 根 的 子 树 。 

树 的 上 述 定 义 是 一 个 递归 定义 ， 其 说 明了 树 的 固有 特性 ， 即 一 棵 树 是 由 若干 棵 子 树 构 
成 的 ， 而 子 树 叉 可 由 若干 棵 更 小 的 子 树 构成 ， 如 图 5-1 所 示 。 树 中 的 结 点 一 般 没 有 次 序 之 
分 ， 其 次 序 可 以 任意 颠倒 。 
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图 5-1 一 个 树 的 示例 


以 递归 定义 分 析 图 5-1 所 示 的 树 ， 其 由 结 点 的 有 限 集 T= {R,4,8,C,D,E,F} 所 构成 ， 其 
中 R 为 根 结 皮 ，T 中 其 余 结 点 可 分 成 两 个 互 不 相交 的 子 集 : TI={4,C,D,E}，7T2={B,F}; 也 
和 荆 是 根 R 的 两 棍子 树 ， 且 本 喘 义 都 是 一 棵 树 ， 例 如 TT!， 其 根 是 4， 其 余 结 点 可 分 为 三 个 
互 不 相交 的 子 集 Ti1={C}、Tis={D} 和 Ti3={E}， 它 们 都 是 4 的 子 树 ， 其 本 身 又 都 是 只 含 一 
个 根 结 点 的 树 。 对 丈 亦 可 以 进行 类 似 的 分 析 。 

因此 ， 采 用 子 树 的 概念 递归 定义 树 为 : 树 是 由 根 结 点 和 若干 棍子 树 构成 的 。 

在 不 同 的 应 用 场合 ， 树 的 表示 方法 可 以 不 同 。 常 见 的 是 树 型 表示 法 、 文 氏 图 表示 法 、 
凹 入 图 表示 法 以 及 广义 表 表 示 法 等 ， 如 图 5-2 所 示 。 





(b) 文 氏 图 表示 法 


(A(B1(C1,C2),B2(C3(D1,D2),C4),B3)) 


(d) 厂 义 表 表 示 法 





图 5-2 树 的 各 种 表示 法 
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例如 图 5-2(a) 所 示 为 树 的 树 型 表示 法 ， 此 图 所 示 的 树 可 以 用 图 5-2(b)、(c) 积 (d) 来 表示 ， 
其 中 (b) 是 用 集合 的 包含 关系 来 描述 树 结构 ， 即 文 氏 图 ，(c) 类 似 于 常见 的 书籍 目录 ，(d) 则 是 
用 广义 表 的 形式 表示 。 


5.1.2 基本 术语 


一 个 结 点 的 子 树 个 数 称 为 该 结 点 的 度 (degree)。 一 棵 树 中 结 点 度 的 最 大 值 称 为 该 树 的 
度 。 度 为 零 的 结 点 称 为 叶子 (leaf) 或 者 终端 结 点 。 如 图 5-1 中 ,， 结 点 4、B、C 的 度 分 别 为 3、 
1、0。 树 的 度 为 3，C、D、E、F 均 为 叶子 。 度 不 为 零 的 结 点 称 为 分 支 结 点 或 者 非 终端 结 
点 ， 除 根 结 点 之 外 的 分 支 结 点 统称 为 内 部 结 点 。 / 

树 中 结 反 的 后 继 结 扣 称 为 儿子 (child) 或 者 儿子 结 点 ， 简 称 儿 子 ; 结 点 的 前 趋 结 点 称 为 
儿子 的 双亲 (parents) 或 者 父亲 结 点 ， 简 称 父亲 。 如 图 5-2(a) 中 ，B2 的 后 继 结 点 为 C3、C4， 
所 以 C3、C4 是 B2 的 儿子 ,而 B2 则 是 C3、C4 的 父亲 。 同 一 个 父亲 的 儿子 互 称 为 兄弟 (sibling)， 
如 图 5-2(a) 中 ，C3、C4 互 为 兄弟 。 

若 树 中 存在 一 个 结 点 序列 oka…,， 使 得 是 ki 的 父亲 (1 二 i 过 7j， 则 称 该 结 点 序列 是 
从 石 到 厂 的 一 条 路 径 (path) 或 者 道路 。 路 径 的 长 度 等 于 六 - 1， 它 是 该 路 径 所 经 过 的 边 ( 即 连 
接 两 个 结 点 的 线段 ) 的 数目 。 由 此 定义 可 知 ， 若 一 个 结 点 序列 是 路 径 ， 则 在 树 型 图 表示 中 ， 
该 结 点 序列 是 “有 目 上 而 下 ”地 通过 路 径 上 的 每 条 边 。 如 图 5-2(a) 中 ， 结 点 4 到 D1 有 一 条 
路 径 4B2C3D1， 其 长 度 为 3。 从 图 中 可 以 看 出 ， 从 树 的 根 结 点 到 树 中 其 余 结 点 均 存 在 一 条 
路 径 。 但 是 结 点 Cl 和 D1 之 间 不 存在 路 径 ， 因 为 既 不 可 能 以 C1 为 出 发 点 “ 自 上 而 下 ”地 
经 过 吞 干 结 点 到 达 D1， 也 不 可 能 以 D1 为 出 发 点 “ 自 上 而 下 ”地 经 过 若干 结 点 到 达 C1。 

石 树 中 络 点 大 到 到 和 仓 在 一 条 路 径 ， 则 称 有 是 的 祖先 (Ancestor), Kk, 是 k 的 子孙 
(Descendant)。 一 个 结 丘 的 祖先 是 从 根 结 点 到 该 结 点 路 径 上 所 经 过 的 所 有 结 点 ,而 一 个 结 点 
的 子孙 则 是 以 该 结 点 为 根 的 子 树 中 的 所 有 的 结 点 。 

税 扩 的 层 数 (level) 是 从 根 开始 算 起 的 。 设 根 结 点 的 层 数 为 1， 其余 结 点 的 层 数 等 于 其 父 
茶 结 点 的 层 数 加 1。 如 图 5-2(a) 中 ，A4 的 层 数 为 1，B1、B2、B3 的 层 数 为 2，C1、C2、C3、 
C4 的 层 数 为 3，D1、D2 的 层 数 为 4。 树 中 结 点 的 最 大 层 数 称 为 树 的 高 度 (Height) 或 者 深度 
(Depth)。 则 图 5-2(a) 所 示 的 树 的 高 度 为 4。 

奇 把 树 中 每 个 结 点 的 各 子 树 看 成 从 左 到 右 有 次 序 的 ( 即 不 能 互 换 )， 则 称 该 树 为 有 序 树 
(Ordered Tree)， 否 则 称 为 无 序 树 (Unordered Tree)。 

森林 (Forest) 是 m(m 宇 0) 棵 互 不 相交 树 的 集合 。 如 图 5-2(a) 所 示 ， 如 果 删 除了 根 结 点 4， 
束 得 到 三 棵 子 树 构 成 的 森林 ; 反之 ， 把 m 棵 独立 的 树 看 作 是 子 树 并 加 上 一 个 根 结 点 ， 则 森 
林 就 变 成 了 树 。 

树 中 结 扣 之 间 所 存在 的 父子 关系 可 以 用 于 描述 树 型 结构 的 逻辑 特征 ， 树 中 任 一 个 结 点 
都 可 以 有 和 零 个 或 者 多 个 后 继 ( 即 儿子 ) 结 点 , 但 至 多 只 能 有 一 个 前 趋 ( 父 亲 ) 结 点 。 树 中 只 有 根 
结 扣 无 前 趋 ， 叶 子 结 点 无 后 继 。 显 然 ， 这 种 父子 关系 是 非 线 性 的 ， 所 以 树 型 结构 是 非 线 性 
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结构 。 祖 先 与 子孙 的 关系 则 是 对 父子 关系 的 延伸 ， 其 定义 了 树 中 结 点 的 纵向 次 序 。 有 序 树 
的 定义 使 得 同一 组 和 匈 弟 络 氮 之 间 是 从 左 到 右 长 幼 有 序 的 。 对 这 一 天 系 进行 延伸 ， 如 果 规 定 
和 厂 是 兄 第 ， 且 所在 局 的 左边 ， 则 右 的 任 一 子孙 都 在 石 的 任 一 子孙 的 左边 ， 从 而 定义 
了 树 中 绪 点 的 横 网 次 序 。 


S.2 ”二 叉 树 的 定义 


二 又 树 是 由 ma 过 0) 结 点 组 成 的 有 限 集合 ,此 集合 或 者 为 空 , 或 者 由 一 个 根 结 点 加 上 两 
柠 分 别称 为 严 、 右 子 树 的 ， 互 不 相交 的 二 叉 树 组 成 。 

从 以 上 递归 定义 中 可 以 看 出 ， 二 文 树 可 以 为 空 集 ， 因 此 根 可 以 有 空 的 左 子 树 或 者 右 子 
树 ， 亦 或 者 左 、 右 子 树 几 为 空 ， 如 图 5-3 所 示 。 


2D OO 


(a) 空 二 叉 树 (b) 仅 有 一 个 根 结 点 的 二 (c) 右 子 树 为 宅 的 一 又 树 
(d) 左 和子 树 为 空 的 二 叉 树 (e) 左 、 右 子 树 均 不 为 空 的 二 叉 树 


图 5-3 二叉树 的 $ 种 形态 


二 义 树 举例 ， 如 图 5-4 所 示 。 结 点 4 是 根 结 点 ，B、C 是 4 的 子 结 点 。 结 点 B 与 D 构 
成 一 棵 子 树 。B 的 两 个 子 结 点 ， 左 子 树 是 空 树 ， 右 子 结 点 是 D。 结 点 4、C 和 无 是 G 的 祖 
先 ， 结 点 D、E 和 下 的 层 数 为 3， 结 点 4 的 层 数 为 1。 从 4 到 G 经 过 C、E 两 个 顶点 三 条 
边 ， 形 成 一 条 长 度 为 3 的 路 径 。 结 点 D、G、 昌 和 了 是 叶 结 点 ，4、B8、C、E 和 玉 是 内 部 结 
点 。 结 点 了 的 深度 为 4。 这 棵 树 的 高 度 为 4。 





图 5-4 二叉树 举例 
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从 二 又 树 定义 中 可 以 看 出 ， 二 又 树 结构 与 一 般 树 结构 区 列 如 下 : 

(1) 二 文 树 可 以 为 空 树 ， 即 不 包含 任何 结 扣 ， 一般 树 至 少 应 有 一 个 缩 丘 。 

(2) 二 又 树 区 别 于 度数 为 2 的 有 序 树 , 在 二 又 树 中 允许 菜 些 绪 点 只 有 右 子 树 而 没有 左 
子 树 ; 而 有 序 树 中 ， 一 个 结 扣 如 果 没 有 第 一 子 树 就 不 可 能 有 第 二 子 树 的 存在 ， 如 图 5-5 
所 示 。 


®Q 





(a) 两 裸 不 同 的 二 丸 树 
图 5-5 ”二叉树 与 一 般 树 


办 此， 二 叉 树 并 非 是 树 的 特殊 情形 ， 它 们 是 两 种 不 同 的 数据 结构 。 


5.3 二叉树 的 性 质 





本 节 讲 述 的 主要 内 容 是 二 又 树 的 基本 性 质 以 及 满 二 叉 树 与 完全 二 又 树 的 异同 。 
5.3.1 ”二叉树 性 质 


性 质 1 二 又 树 第 ii 三) 层 上 的 结 点 数 最 多 为 2 。 

证 明 : 第 一 层 有 一 个 结 点 ， 第 二 层 最 多 有 两 个 结 点 ， 第 三 层 最 多 有 四 个 结 点 ， 以 此 类 
推 。 数 学 归纳 法 证 明 如 下 : 

归纳 基础 :二 1 时 ， 有 2”=2 =1。 因 为 第 一 层 上 只 有 一 个 结 点 ， 即 根 结 点 ， 所 以 命题 
成 并。 
归纳 假设 ;假设 对 所 有 的 j(1 志 j<< 丫 命题 成 立 ， 即 第 ) 层 上 至 多 有 2 个 结 点 ， 需 要 证 
明 二 i 时 命题 亦 成 立 。 

归纳 步 又 ， 根据 归纳 假设 ,第 i- 1 层 上 至 多 有 2 天 个 结 点 。 由 于 二 叉 树 的 每 个 结 点 至 
多 有 两 个 儿子 ， 故 第 i 层 上 的 结 点 数 至 多 是 第 ;- 1 层 上 的 最 大 结 点 数 的 2 倍 ， 即 j=i 时 ， 
该 层 上 至 多 有 2X2”=2"! 个 结 点 ， 因 此 命题 成 立 。 : 

性 质 2 ”高 度 为 的 二 又 树 最 多 有 2- 1 个 结 点 。 

根据 性 质 1， 将 各 层 的 结 点 个 数 相 加 ， 即 可 推导 出 性 质 2。 即 
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> -2 -1 
性 质 3 对 任何 二 又 树 7, 设 no、m、ns 分 别 表示 度数 为 0、1、2 的 结 点 个 数 , 则 no=nz+t1。 
证 明 : 因为 二 叉 树 中 所 有 结 点 的 度数 均 不 大 于 2， 所 以 结 点 总 数 ( 记 为 四 应 该 等 于 0 度 
结 点 数 (no)、1 度 结 点 数 (m) 和 2 度 结 点 数 (m2) 之 和 : 


n=notni1t+n> 


再 者 ，1 度 结 点 有 一 个 儿子 ，2 度 结 点 有 两 个 儿子 ， 所 以 二 叉 树 中 儿子 结 点 的 总 数 是 
ni+2n2， 二 叉 树 中 只 有 根 结 点 不 是 任何 结 点 的 儿子 ， 因 此 二 又 树 中 的 结 扣 总 数 可 以 表示 为 : 


n=ni1+2n2+1 
由 上 述 公式 可 得 : 
no=n2+1 


由 性 质 3 可 以 推导 出 : 当 n=0 时 ，no=1。 即 该 二 叉 树 有 一 个 起 始 结 点 ( 根 ) 和 一 个 终端 
结 点 (叶子 )， 其 他 各 结 点 有 一 个 父亲 一 个 儿子 ， 二 又 树 退 化 为 单 链表 。 

满 二 又 树 和 完全 二 又 树 是 二 叉 树 的 两 种 特殊 情形 。 

一 棵 深度 为 k 且 有 2  - 1 个 结 点 的 二 叉 树 称 为 满 二 叉 树 。 

如 图 5-6 所 示 是 深度 分 别 为 1、2、3 的 满 二 又 树 。 满 二 又 树 的 特点 是 每 一 屋 上 的 结 点 
数 都 达到 最 大 值 ， 即 对 给 定 的 深度 ， 它 是 具有 最 多 结 点 数 的 二 又 树 。 满 二 又 树 不 存在 度数 
为 1 的 结 点 ， 每 个 分 文 结 点 均 有 两 标高 度 相 同 的 子 树 ， 且 树叶 都 在 最 下 一 层 上 。 


多 





(a) 深度 为 1 的 满 二 又 树 。 (b) 深度 为 2 的 满 二 叉 树 (c) 深度 为 3 的 满 二 又 树 
图 5-6 三 种 不 同 深度 的 满 二 又 树 
若 一 棵 二 又 树 至 多 只 有 最 下 面 的 两 层 结 点 的 度数 可 以 小 于 2， 并 且 最 下 一 层 上 的 结 点 


都 集中 在 该 层 最 左边 的 看 二 位置 上 ， 则 此 二 又 树 称 为 完全 二 又 树 。 
如 图 5-7 所 未 为 完全 二 又 树 不 例 。 
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由 定义 及 示例 可 以 看 出 满 二 叉 树 是 完全 二 叉 树 ， 但 完全 二 又 树 不 一 定 是 满 二 又 树 。 在 
满 二 叉 树 的 最 下 一 层 上 从 最 右边 开始 连续 删 去 若干 结 点 后 得 到 的 二 又 树 仍然 是 一 棵 二 又 
树 。 因 此 ， 在 完全 二 又 树 中 ， 车 某 个 结 点 没有 左 儿 子 ， 则 它 一 定 没有 右 儿 子 ， 即 该 结 点 必 
是 叶 结 点 。 如 图 5-8 所 示 ， 结 点 五 没有 左 儿 子 而 有 右 儿子 L， 故 它 不 是 一 棵 完全 二 叉 树 。 


CX CO 


| 


HB {1 
图 5-8 ”一 棵 非 完 全 二 又 树 

性 质 4 具有 7 个 结 友 的 完全 二 叉 树 (包括 满 二 叉 树 ) 的 高 度 为 |jogyn |+1( 或 者 
log,(n +1) |): 

证 明 : 设 所 求 完 全 二 又 树 的 深度 为 k， 由 完全 二 叉 树 的 定义 知道 ， 其 前 -1 层 是 深度 为 
k-1 的 满 二 叉 树 , 一 共有 2” -1 个 结 点 。 由 于 完全 二 又 树 深度 为 k， 故 第 层 上 还 有 若干 个 
结 点 ， 因 此 ， 该 完全 二 叉 树 的 结 点 个 数 二 2”! - 1。 再 者 ， 由 性 质 2 知道 n 志 2 - 1， 即 

2 - 1<n<2 -1 
由 此 推导 得 2”' 志 4 二 2 ， 取 对 数 后 有 : 
k~- 1<logn<k 
因为 大 为 整数 ， 所 以 有 k- 1=| log | ， 即 可 得 k=| logz|+1。 


性 质 5 满 二 又 树 原 理 非 空 满 二 又 树 的 叶 结 点 数 等 于 其 分 支 结 点 数 加 1。 

证 明 : 对 n( 分 支 结 乓 个 数 ) 做 数学 归纳 法 。 

归纳 基础 :没有 分 支 结 点 的 非 空 二 叉 树 有 一 个 叶 结 点 。 有 一 个 分 支 结 点 的 满 二 叉 树 有 
两 个 叶 绪 点 ， 即 当 n=0 及 n=1 时 此 定理 成 立 。 
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归纳 假设 ; 设 任意 一 棵 有 n - 1 个 分 支 结 点 的 满 二 又 树 有 n 个 叶 结 点 。 

归纳 步骤 : 假设 树 7 有 n 个 分 支 结 点 ， 取 一 个 左右 子 结 点 均 为 叶 结 点 的 分 支 结 点 1。 
去 掉 了 的 两 个 子 结 点 ， 则 了 成 为 叶 结 点 ， 把 新 树 记 为 T'，T' 有 n -1 个 分 支 结 点 ， 根 据 归 纳 
假设 ，7' 有 个 叶 结 点 ， 现 在 把 两 个 叶 结 点 归还 给 7。 从 而 得 到 了 有 n 个 分 支 结 点 。 既 然 
T' 有 nn 个 叶 结 点 ， 再 加 上 两 个 则 得 到 了 有 n+2 个 叶 结 点 ， 但 是 在 T 中 结 点 了 被 计算 为 叶 结 
点 ， 而 现在 则 是 分 支 结 点 ， 于 是 树 T 有 n+l 个 叶 结 点 和 个 分 支 结 点 。 

因此 ， 根 据 归纳 原理 ， 定 理 对 于 任意 n 宕 0 成 立 。 

性 质 6 一 棵 非 空 二 又 树 空子 树 的 数目 等 于 其 结 点 数目 加 1。 

证 明 1 设 二 又 树 T7， 将 其 所 有 空子 树 换 成 叶 结 扣 ， 把 新 的 二 又 树 记 为 T'。 所 有 原来 
的 树 T 的 结 点 现在 是 树 7' 的 分 支 结 点 。 由 于 树 7 的 所 有 分 支 结 点 都 有 两 个 子 结 点 ， 并 和 且 
树 7 中 的 每 个 叶 结 点 在 树 7' 中 都 有 两 个 叶 结 点 ， 所 以 树 T* 是 满 二 叉 树 。 根 据 满 二 叉 树 定 
理 ， 新 添加 的 叶 结 点 数目 等 于 树 了 的 结 点 数目 加 1， 而 每 个 新 添加 的 叶 结 点 对 应 树 了 的 一 
棵 空子 树 ， 因 此 树 了 中 空子 树 的 数目 等 于 树 了 中 结 点 数目 加 1。 

证 明 2 根据 定义 , 树 T 中 每 个 结 点 都 有 两 个 子 结 点 , 因此 一 棵 (实际 上 ) 有 个 结 点 的 
二 叉 权 有 2 个 子 结 点 。 除 了 根 结 点 以 外 ， 每 个 结 点 都 有 一 个 父 结 点 ， 于 是 共有 n - 1 个 父 
结 点 ， 即 有 n - 1 个 非 空子 结 点 。 既 然 子 结 点 数目 为 2x?， 则 其 中 有 n+1l 个 为 空 。 


5.3.2 二 又 树 的 抽象 数据 类 型 


下 列 给 出 一 个 二 叉 树 结 点 的 Java 接口 ， 称 之 为 BinNode。BinNode 类 中 存储 了 指向 
Object 类 的 引用 。 创 建 二 叉 树 时 ， 可 以 根据 需要 而 采用 实际 的 数据 类 型 。 成 员 函 数 包括 返 
加 元 素 的 值 ， 返 回 左 、 右 结 点 指针 ， 设 置 元 素 的 值 ， 判 断 该 结 点 是 否 为 叶 结 点 。 


interface BinNode { // 二 又 树 结 点 的 抽象 数据 类 型 
// 返 回 并 设置 元 素 值 

public Object clement(); 

public Object setElement(Object v); 


1/ 返回 并 设置 左 孩 子 
public Binnode left(); 
public Binnode setLeft( BinNode p); 


1/ 返回 并 设置 右 孩 子 
public Binnode right(); 
public Binnode setRight(BinNode p); 


// 判 断 是 否 为 叶 结 点 
public boolean isLeaf(); 
}//interface BinNode 
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5.4 ”二叉树 的 存储 结构 








本 节 讲 述 的 主要 内 容 为 二 又 树 的 存储 结构 : 顺序 存储 结构 和 链接 存储 结构 ， 以 及 二 叉 
树 的 实现 。 


5.4.1 二 义 树 的 顺序 存储 结构 


二 又 树 的 顺序 存储 结构 是 把 二 又 树 的 所 有 结 点 按照 一 定 的 次 序 顺序 存储 到 一 组 包含 n 
个 存储 单元 的 空间 中 。 在 三 叉 树 的 顺序 存储 结构 中 只 存储 结 点 的 值 (数据 域 )， 不 存储 结 点 
之 间 的 逻辑 关系 ， 结 点 之 间 的 逻辑 关系 由 数组 中 下 标的 顺序 来 体现 。 

二 义 树 顺序 存储 的 原则 是 : 不 管 给 定 的 二 叉 树 是 不 是 完全 三 叉 树 , 都 看 作 完全 二 又 树 ， 
即 按 完 全 三 叉 树 的 层次 次 序 ( 从 上 到 下 ， 从 左 到 右 ) 把 各 结 点 依次 存 入 数组 中 。 如 图 5-9 所 
示 为 二 叉 树 的 顺序 存储 结构 。 
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(b) 一 般 二 叉 树 的 顺序 存储 


5-9 二 又 树 顺 序 存储 结构 示意 图 





在 顺序 存储 结构 中 ， 由 某 结 点 的 存储 单元 地 址 可 以 推出 其 父亲 、 左 儿子 、 右 儿子 及 兄 
第 的 地 址 ， 假 设 给 定 结 点 的 地 址 为 1， 则 : 

(1) 者 1 二 1， 则 该 结 点 是 为 根 结 点 ， 无 父亲 。 

(2) 看 [ 径 1， 则 该 结 点 的 父亲 结 点 地 址 为 1/2 的 整数 部 分 。 

(3) 者 2XI<n， 则 该 结 点 的 左 儿 子 结 点 地 址 为 2XI， 否 则 该 结 点 无 左 儿子 。 

(4) 车 2XIt1<n， 则 该 结 点 的 右 儿子 结 点 地 址 为 2XH1， 否 则 该 结 点 无 右 儿 子 。 

(5) 在 7 了 为 奇数 (不 为 )， 则 该 结 点 的 左 兄弟 为 了 T- 1。 

(6) 右 了 为 偶数 (不 为 n)， 则 该 结 点 的 右 兄弟 为 +1。 

企图 5-9(a) 中 , 结 点 C 的 地 址 三 3, 其 父亲 4 在 S[i/2j( 即 SE1]) 中 ;其 左 儿子 在 Sf[2*7( 即 
ST6]) 中 ， 其 右 儿 子 G 在 ST[2*I+1]( 即 S[7]) 中 ， 其 右 兄弟 B 在 S[7- 1]( 即 S[2]) 中 。 

而 在 图 5-9(b) 中 ， 结 点 C 的 地 址 三 3， 其 左 儿 子 应 在 S[6] 中 ， 而 SI1] 的 内 容 为 空 ， 故 结 
所 C 没有 左 儿 子 ; 结 点 下 的 地 址 三 10， 其 左 、 右 儿子 应 分 别 在 S[20] 和 ST21] 中 , 但 20 已 
经 超出 数组 的 下 标 范围 ， 故 结 点 已 没有 儿子 。 
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显然 地 , 顺序 存储 结构 对 完全 三 灵 树 而 言 s 既 简单 又 节省 存储 空间 。 对 于 一 般 二 叉 树 ， 
为 了 能 用 结 点 在 数组 中 的 相对 位 置 表 示 结 点 之 间 的 逻辑 关系 ， 也 必须 按 完 全 二 又 树 的 形式 
来 存储 树 中 的 结 点 ， 这 必然 造成 存储 空间 的 浪费 ， 这 是 因为 顺序 结构 中 存储 很 多 空 结 扩 ， 
而 且 随 三 又 树 高 度 的 增 大 ， 室 结 点 的 数量 也 会 急速 增多 。 如果 采 用 存储 压缩 的 方法 把 表 中 
的 空 结 点 压缩 掉 ， 又 必然 会 给 二 又 树 的 访问 、 插 入 、 删 除 等 带 来 极 大 的 不 便 。 在 最 坏 的 情 
况 下 ， 一 个 高 度 为 k 且 只 有 个 结 点 的 右 单 支 树 却 需 要 2 - 1 个 结 点 的 存储 空间 。 


5.4.2” 二叉树 的 链接 存储 结构 


由 于 采用 顺序 存储 结构 存储 一 般 二 又 树 造成 大 量 存储 空间 的 浪费 ， 因 此 ， 一 般 三 又 树 
的 存储 结构 更 多 地 采用 链接 的 方式 。 

二 又 树 的 链接 存储 中 每 个 结 点 由 数据 域 和 指针 域 两 部 分 组 成 。 二 叉 树 每 个 结 点 的 指针 
域 有 两 个 ,一 个 指向 左 儿 子 ， 一 个 指向 右 儿 子 ， 如 图 5-10 所 示 。 ne 
针 指 向 根 结 点 。 二 又 树 的 链接 存储 结构 也 称 为 二 又 链表 。 


Lehil Rehild 


图 5-10 三叉 树 链接 存储 结构 


若 二 又 树 为 空 ， 则 根 结 点 为 NULL。 若 结 点 的 某 个 儿子 不 存在 ， 则 相应 的 指针 为 空 。 
具有 nn 个 结 点 的 二 叉 树 中 ， 一 共有 2n 个 指针 域 ， 其 中 只 有 n - 工 个 用 来 指示 结 氮 的 雹 右 儿 
子 ， 其 余 的 n+l 个 指针 域 为 空 。 

图 5-11 是 二 叉 树 图 形 表 示 ( 逻 辑 结 构 ) 及 其 二 又 链表 表示 (存储 结构 )。 





图 5-11 ”二叉树 的 二 又 链表 表示 


下 面 给 出 一 个 二 又 树 结 点 类 BinNodePtr 的 声明 , 它 表 示 二 了 叉 树 结 点 采用 包含 一 个 数据 
区 和 两 个 指向 子 结 点 的 指针 结构 时 的 成 员 函 数 的 说 明 。 


// 具 有 指向 左右 子 结 点 指针 的 二 又 树 

class BinNodePtr implements BinNode { 
private 6bject'element; / 结 点 对 象 
private BinNode left; // 左 儿子 指针 
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private BinNode right; // 右 儿子 指针 


public BinNodePtr() {left = right =null: } /创建 结 点 1 
public BinNodePtr(Object val) { /创建 结 点 2 

left = right =null; 
element = val: 


4 


public BinNodePtr(Object val, BinNode 1 BinNode fr) // 创 建 结 点 3 
{ left = 1 right = 1; element = val; } 


// 返 回 和 设置 元 素 值 
public Object element() { return element, } 
pubiic Object setElement(Object v) { return element = v; } 


// 返 回 和 设置 左 儿 子 
public BinNode leftO { return left; } 
public BinNode setLeft(BinNode p) { return left = p; } 


/返回 和 设置 右 儿 子 
public BinNode right() { return right; } 
public BinNode setRight(BinNode p) { returm right = p; } 


1/ 判断 叶 子 结 后 
public boolean 1sLeaf\) 


{ return (left = null) && (right = null); } 
}//class BinNodePtr 


5.4.3 二叉树 的 实现 举例 


二 又 树 的 实现 原则 为 ， 

e 以 第 一 个 建立 的 元 素 为 根 结 点 。 / 

e。 依次 序 将 元 素 值 与 根 结 点 做 比较 ， 若 元 素 值 大 于 根 结 点 值 ， 则 将 元 素 值 往 根 结 点 的 
右 子 结 所 移动， 用 此 右 子 结 点 为 空 ， 则 将 元 素 值 插入 ;和 否则 就 重复 比较 ， 直 到 找到 
运 当 的 空 结 点 为 止 。 才 元 素 值 小 于 根 结 点 值 , 则 将 元 素 值 往 根 结 点 的 左 子 结 点 移动 ， 
若 此 左 子 结 点 为 空 ， 则 将 元 素 值 插入 ;否则 就 重复 比较 ， 直 到 找到 适当 的 空 结 点 
为 止 。 


1. 以 数组 方式 实现 二 叉 树 
先 依次 序 输 入 元 素 值 ， 一 一 建立 二 叉 树 数组 ， 其 中 根 结 点 的 下 标 为 1， 其 余 结 点 的 建 
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立 则 遵循 左 小 (level*2) 右 大 (level*2+1) 的 原则 ， 最 后 输出 所 建立 二 又 树 的 结 点 内 容 。 
import ConsoleReader.*; // 引 入 数据 输入 类 


public class bltree01 

{ 

public static void main (String args|]) 

LH 

int i; /循环 变量 
int Index=1; // 数 组 下 标 变 量 
int Data; // 读 取 输 入 值 的 临时 变量 
BiTreeArray BiTree=new BitreeArray0; /声明 二 叉 树 数组 
System.out.printin(" 请 输入 二 又 树 数据 元 素 ( 输 入 0 退出 ! ): "); 


ConsoleReader console=new ConsoleReader(System.ln); 


do // 依 次 序 读 取 结 反 值 

t 
System.out.print(" Data +Index+ : "); 
Data=console.readInt( ); 
Bitree.Create(Data); /建立 二 叉 树 
Index 二 十 ; 

}while(Data!=0); 

BiTree.PrintAllO; /输出 二 又 树 的 结 乓 什 

} 
和 


class BiTreeArray 


Int MaxSize=16; 
int[] ABiTree=new int[MaxSize]; 


public void BiTreeArray() 
{ 


Int 1; 
for (1=0;1<MaxSize;1++) 
ABiTreelil=0; 

} 


/建立 二 又 树 
public vold Create(int Data) 
‘ 


int 1; 


int Level: / 树 的 层 数 
Level=1: /从 层 1 开始 建 芯 
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while(ABiTree[Level]!=0) // 判 断 是 否 存在 子 树 
{ 
if Data<ABiTree[Level])// 判 断 是 左 子 树 还 是 右 子 树 
Level=Level*2; // 左 子 树 
else 
Level=Level*2+1: // 右 子 树 


} 
ABiTree[Level]=Data; // 将 元 素 值 插 入 结 点 


// 输 出 二 又 树 结 点 值 
public void PrintAll() 
{ 
int 1: 
System.out.println(" 二 叉 树 结 点 值 依 次 是 : 内; 
for (1=1;1<MaxSize;i++) 
{ 
System.out.print("Node"+1i); 
System.out.println(":[ "+ABiTree[i+ "1'); 


} 


2. 以 数组 方式 实现 二 叉 树 的 链接 存储 


定义 一 个 类 ， 该 类 包含 三 个 字段 ， 一 个 字段 用 于 存放 结 点 的 数据 值 ， 另 两 个 字段 分 别 
用 于 存放 左 儿 子 结 点 和 右 儿子 结 点 在 数组 中 的 下 标 。 
结 点 数组 的 元 素 结构 为 : 


child | 。 data 


其 中 ，data 为 存放 结 点 的 数据 值 ，lchild 为 存放 左 儿子 结 点 在 数组 中 的 下 标 ; rchild 为 
存放 右 儿 子 结 点 在 数组 中 的 下 标 。 

在 结 扩 数组 中 ,会 将 根 结 点 置 于 数组 结构 中 下 标 为 0 处 ， 将 结 点 值 存在 data 字段 ， 而 
lchild 及 rchild 字段 则 分 别 存储 左右 子 结 点 在 数组 结构 中 的 下 标 , 若 子 结 点 不 存在 则 存 值 - 1。 
例如 ， 有 一 棵 二 又 树 的 树 状 结构 与 结 点 数组 表示 法 如 图 5-12 所 示 。 





图 5-12 二 又 树 的 树 状 结构 及 其 数组 表示 法 
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其 中 根 结 扣 为 4，4 在 结 点 数组 下 标 为 0 处 ， 其 左 子 结 点 B 在 下 标 为 1 处 ， 右 子 结 点 


在 下 标 为 2 处 ， 故 结 点 4 的 1child 字段 和 rchild 字段 分 别 是 1 和 2。 而 结 点 C 的 rchild 字 
段 值 为 - 1， 表 示 其 没有 右 子 结 点 。 而 结 点 D 和 五 都 是 叶 结 点 (leaf node) 没 有 子 结 点 ， 故 


lchild 和 rchild 字段 均 为 - 1。 

以 下 示例 为 以 结 氮 数组 方式 建立 二 又 树 ， 并 输出 结 点 内 容 。 依 次 序 输入 结 点 值 ， 并 存 
入 数组 中 ， 再 一 一 建立 成 二 叉 树 数组 ， 其 中 根 结 点 的 下 标 为 0， 其 余 结 点 的 建立 则 遵守 左 
字段 存 左 子 结 点 的 下 标 , 右 字段 存 右 子 结 点 下 标的 原则 ; 最 后 输出 所 建立 二 叉 树 的 结 点 值 。 


import ConsoleReader.*; /引入 已 定义 的 数据 输入 类 


public class bitree02 
{ 
public static void main(String argS[]) 
人 
int i; // 衢 环 变量 
int index= /数组 下 标 变 量 
int data; /输入 值 所 使 用 的 临时 变量 
BiTreeArray BiTree=new BiTreeArray0yV/ 声 明 一 又 树 数组 


System.out.println(" 请 输入 二 又 树 结 点 值 (输入 0 退出 0):， 由 ; 


ConsolReader console=new ConsoleReader(SyStem.in): 


System.out.print("Data"+index+"” :  "); 
Data=console.readInt(); 
BiTree.TreeData[0]=data: 

indeXx+ 十 ， 


while (true) / 读 取 输入 值 
System.out.print("Data "+index+”:， "); 
data=console.readInt(); 
if (data=—=0) 

break: 
BiTree.Create(data); // 建 并 二 叉 树 
index++; 
} z 
BiTree.PrintAlO; /输出 二 叉 树 的 内 容 


} 


class BiTreeArray 

{ 
int MaxSize=16; 
Int[] TreeData=new int[MaxSize]; 
int[] RightNode=new int[MaxSize]; 
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Int[] LeftNode=new int{[MaxSizel; 


public BiTreeArray() 
{ 
int i; /循环 变量 
for (1=0; i<MaxSize; i++) 
{ 
TreeData[i}=0; 
RightNode[i}=-1; 
LeftNode[i]l=-1; 


} 


// 建 立 二 叉 树 
public vold Create(int data) 
| 
int 1， 
int level=0: // 树 的 层 数 


int Position=0; 


for (i=0; TreeData[il!=0; i++) 
TreeData[i]=data; 
while (true) // 寻 找 结 点 位 置 
LH 
1 判断 是 左 子 树 还 是 右 子 树 
if (data > TreeDatafLevel]) 
/石子 树 是 否 有 下 一 层 
if (RightNodellevel]!=-1) 
level=RightNode[levell; 
else 


{ 


Break， 
， 
else 
// 左 子 树 是 否 有 下 一 层 
"if (LeftNodeflevel]!=-1) 
level=LeftNode[llevel]; 
else. : 


{ 


Position=1: /设置 为 左 子 树 


break.; 


Position=-1; // 语 置 为 右 子 树 - 
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} 
} 
if (Position 二 1) /建立 绪 点 的 无 右 连接 
LefNodeflevell=i; /连接 左 子 树 
else 
RightNode[level]=i; /连接 右 子 树 
} 


/打印 所 有 二 又 树 结 点 值 
public void PrintAll() 
t 


Int 1: 


System.out.println(" 二 又 树 结 点 值 : "); 
9ystetm.out.println(” [lchildj {datal [rehild] "); 
for (i=0;i<MaxSize:i++) 
LH 
if(TreeData[i]!=0) 
t 
System.out.pPrint( Node 十 1; 
System.out.print(" ["+LeftNodefi]+ "]"); 
System.out.print(” "+TreeData[i]+ "]"): 
System.out.println(”  ["+RightNode[i}+ "]"): 


} 


以 上 程序 的 结构 可 以 改善 二 叉 树 数组 表示 法 中 ， 若 要 插入 或 删除 结 点 需要 移动 大 量 数 
据 的 问题 。 因 为 有 两 个 字段 lchild 和 rchild 来 存储 左右 子 树 的 下 标 ， 所 以 插入 或 删除 结 点 
时 只 要 改变 这 两 个 字段 值 ， 而 不 需要 大 量 移动 数据 。 


5s.5 二 叉 树 的 遍历 


本 市 讲述 的 主要 内 容 为 二 又 树 的 前 序 遍 历 、 中 序 遍 历 以 及 后 序 遍 历 的 方法 。 

“遍历 ”是 抽取 数据 结构 中 的 各 个 数据 值 ， 例 如 : 数组 和 链表 可 从 前 端 到 尾 端 或 从 尾 
峭 全 前 器 依 序 抽取 各 个 数据 值 。 而 二 又 树 是 一 种 特殊 的 数据 结构 ， 每 个 结 点 下 又 各 有 左 、 
右 两 个 分 文 。“ 二 义 岩 的 过 历 ”是 以 固定 的 顺序 ， 系 统 地 抽取 二 叉 树 中 的 各 结 点 ， 且 每 个 
结 点 均 恰好 被 抽取 一 次 。 

二 又 树 中 每 个 结 点 均 有 左右 两 个 分 支 ， 在 遍历 的 过 程 中 可 以 选择 往 左 或 往 右 走 ， 遍 历 
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结束 ， 每 个 结 点 恰 被 抽取 一 次 。 事 实 上 ， 二 叉 树 的 遍历 是 以 递归 的 方式 进行 ， 依 递归 的 调 
用 顺序 的 不 同 ， 可 分 为 3 种 不 同 的 遍历 方式 ， 
。 前 序 遍 历 方式 
。 中 序 遍历 方式 


。 后 序 遍 历 方式 
5.5.1 二 义 树 的 前 序 遍 历 


前 序 授 历 (Preorder Traversal) 是 先 遍历 根 结 点 ， 再 遍历 左 子 树 ， 最 后 才 遍 历 右 子 树 。 即 
右 二 又 树 非 空 ， 则 依次 进行 如 下 操作 : 

(1) 访问 根 结 点 ; 

(2) 前 序 裔 历 左 子 树 ; 

(3) 有 醒 序 遍历 右 子 树 。 

例如 图 5-13 所 示 。 


B ) ( CC 
(D (E) (F) 
G ) (H) 





图 5-13 一 棵 二 又 树 


图 5-13 中 处 理 完 根 结 点 4 后 ， 先 往 左 子 树 经 过 B 再 到 D， 由 于 D 有 左 子 树 ， 故 继续 
丢 辣 左 子 树 G。 再 回 到 B， 因 为 B 没 有 右 子 树 ， 所 以 此 时 4 的 左 子 树 均 遍 历 完毕 六" 则 转向 


4 的 右 子 树 ， 先 到 C， 再 往 左边 继续 遍历 ， 依 此 类 推 ， 故 可 得 到 前 序 遍 历 的 顺序 为 
ABDGCEHFI。 


前 序 裔 历 的 递归 算法 如 下 : 
if 指 回 根 结 点 的 指针 =NULL then 
(1) 处 理 当 前 的 结 点 
(2) 和 住 左 走 ,递归 处 理 preorder(root->left) 
(3) 往 右 走 , 递 归 处 理 preorder(root->right) 
此 为 空 树 ,遍历 结束 


else 
Java 语言 实现 示例 为 : 


void preorder(BinNode rt) /rt 是 子 树 的 根 
ft 
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if (rt 一 null) return; /空子 树 
visit(rt); 

preorder(rt.left()); 
preorder(rt.right()); 


5.5.2 ”二叉树 的 中 序 遍 历 


中 序 遍 历 (Inorder Traversal) 是 先 遍 历 左 子 树 ， 再 遍历 根 结 点 ， 最 后 才 裔 历 右 子 树 。 即 
若 二 叉 树 非 空 ， 则 依次 进行 如 下 操作 : : 

(1) 中 序 遍 历 左 子 树 ; 

(2) 访问 根 结 后 ; 

(3) 中 序 壳 历 右 子 树 。 

以 图 5-13 为 例 ， 从 结 点 4 开始 ， 一 直 往 左 走 到 G 无 法 再 前 进 ， 则 处 理 D。 此 时 已 遍 
历 完 B 的 左 子 树 ， 接 着 处 理 8， 再 往 B 的 右 方 前 进 。 由 于 B 没 有 右 子 树 ， 故 4 的 左 子 树 过 
历 完 毕 ， 可 处 理 节点 4， 再 往 4 的 右 子 树 前 进 ， 依 此 类 推 ， 故 可 得 到 中 序 遍 历 的 次 序 为 
GDBAHECFI, 

中 序 遍 历 的 递归 算法 如 下 : 

if 指向 根 绪 点 的 指针 =NULL then 
(1) 往 左 走 ,递归 处 理 inorder(root->left) 
(2) 处 理 当 前 的 结 扣 
(3) 往 右 走 ,递归 处 理 inorder(root- >right) 
此 为 空 树 , 人 遍历 结束 


else 
Java 语言 实现 示例 为 ， 


void inorder(BinNode rt) /rt 是 子 树 的 根 
if (rt 一 nulb return; /空子 树 
inorder(rt.left()); 

Visit(rt); 
inorder(rt.right()); 
} 


5.5.3 ”二 又 树 的 后 序 遍 历 


后 序 授 历 (Postorder TraversaD 是 先 过 有 历 左 子 树 ， 再 过 历 右 子 树 ， 最 后 才 遍 历 根 结 点 。 
即 若 二 又 树 非 空 ， 则 依次 进行 如 下 操作 : 
(1) 后 序 壳 历 左 子 树 ; 
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(2) 后 序 壳 历 右 子 树 ; 

(G3) 访问 根 绪 氮 。 

以 图 5-13 为 例 ， 从 绪 氮 4 开始 一 直 往 左 走 到 G 无 法 再 前 进 ， 由 于 G 没有 左 、 右 子 树 ， 
故 处 理 结 点 G。 之 后 由 于 万 的 左 子 树 壳 有 历 完 毕 ， 且 无 右 子 树 ， 故 进而 处 理 九 ,而 至 的 左 子 
树 也 相应 地 完成 。 且 结 氮 瑟 没 有 右 子 树 ， 故 可 接着 处 理 刀 。 此 时 结 点 4 的 左 子 树 已 遍历 完 
毕 ， 可 进而 往 4 的 右 子 树 经 过 C 往 前 进 ， 依 此 类 推 ， 当 4 的 右 子 树 遍 历 完 毕 后 ， 方 可 处 理 
根 结 上 把 4， 故 可 得 到 后 序 壳 历 的 顺序 为 GDBHEIFCA。 

后 序 遍 历 的 递归 算法 如 下 : 

if 指 同根 结 点 的 指针 =NULL then 
(1) 往 左 走 ,递归 处 理 postorder(root->left) 
(2) 往 右 走 , 递 归 处 理 postorder(root->right) 
(3) 处 理 目前 的 结 点 
些 为 空 树 , 遍 有 历 结束 


else 
Java 语言 实现 示例 为 : 


void postorder(BinNode rb /rt 是 子 树 的 根 


人 
if (rt == null) return; /空子 树 
postorder(rt.left()); 
postorder(rt.right()); 
VISIt(rt); 


1 
5.5.4 二叉树 的 层次 遍历 


层次 过 历 是 指 从 二 又 树 的 第 一 层 ( 根 结 点 ) 开 始 ， 从 上 至 下 逐 层 遍历 ， 在 同一 层 中 ， 则 
按 从 左 到 右 的 顺序 对 结 点 逐个 访问 。 
以 图 5-13 为 例 ， 按 层次 遍历 方式 进行 遍历 所 得 到 的 的 结果 序列 为 : 


ABCDEFGHI 


由 层次 遍历 的 定义 可 以 推 知 ， 在 进行 层次 遍历 时 ， 对 一 层 结 点 访问 完 后 ， 再 按照 它们 
的 访问 次 序 对 各 个 结 点 的 左 孩 子 和 右 孩 子 顺序 访问 ， 就 完成 了 对 下 一 层 从 左 到 右 的 访问 。 
因此 ， 在 进行 层次 遍历 时 ， 需 设置 一 个 队列 结构 ， 遍 历 从 二 叉 树 的 根 结 点 开始 ， 首 先 将 根 
结 点 指针 入 队 ， 然 后 从 队 头 取出 一 个 元 素 ， 每 取出 一 个 元 素 ， 执 行 两 个 操作 :访问 该 元 素 
所 指 结 点 ， 若 该 元 素 所 指 结 点 的 左 、 右 孩子 结 点 非 空 ， 则 将 该 元 素 所 指 结 点 的 左 孩 子 指针 
和 右 孩 子 指针 顺序 入 队 。 此 过 程 循环 进行 ， 直 至 队列 为 空 ， 表 示 二 又 树 的 层次 遍历 结束 ， 
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所 以 ， 对 一 棵 非 空 的 二 文 树 进 行 层 饮 遍 历 可 按照 如 下 步骤 进行 :; 
(1) 初始 化 一 个 队列 ; 

(2) 二 文 树 的 根 结 扣 放 入 队列 ; 

(3) 重复 步骤 (4)~(7) 直 至 队列 为 空 ， 

(4) 从 队列 中 取出 一 个 结 点 x; 

($) 访问 结 点 x; : 

(6) 如 果 x 存在 左 子 结 点 ， 将 左 子 结 点 放 入 队列 ; 

(7) 如 果 x 存在 右 子 结 点 ， 将 右 子 结 点 放 入 队列 。 


S.6 ”线索 二 叉 树 


本 节 讲 述 的 主要 内 容 为 二 又 树 线索 化 的 概念 以 及 前 序 线索 二 又 树 、 中 序 线索 二 叉 树 和 
后 序 线索 二 又 树 。 


5.6.1 ”二叉树 的 线索 化 


在 线性 结构 中 ， 各 结 点 的 逻辑 关系 是 顺序 的 ， 寻 找 某 一 结 点 的 前 趋 结 点 和 后 继 结 点 很 
方便 。 对 于 二 叉 树 ， 由 于 它 是 非 线性 结构 ， 所 以 树 中 的 结 点 不 存在 前 趋 和 后 继 的 概念 ， 但 
当 我 们 对 二 又 树 以 某 种 方式 遍历 后 ， 就 可 以 得 到 二 叉 树 中 所 有 结 点 的 一 个 线性 序列 ， 在 这 
种 意义 下 ， 二 叉 树 中 的 结 点 就 有 了 前 趋 结 点 和 后 继 结 点 。 

二 叉 树 通常 采用 二 又 链表 作为 存储 结构 ， 在 这 种 存储 结构 下 ， 由 于 每 个 结 点 有 两 个 分 
别 指向 其 左 儿 子 和 右 儿 子 的 指针 ， 所 以 寻找 其 左 、 右 儿子 结 点 很 方便 ， 但 要 找 该 结 点 的 前 
趋 结 点 和 后 继 结 点 则 比较 困难 。 例如， 要 在 中 序 遍 历 的 前 提 下 ,寻找 任 一 结 点 的 前 趋 结 点 ， 
如 果 该 结 点 存在 左 儿子 结 点 ， 那 么 从 该 左 儿子 结 点 开始 ， 沿 着 右 指针 链 不 断 向 下 找 ， 当 某 
结 点 的 右 指针 域 为 空 时 , 该 结 点 就 是 所 要 寻找 的 前 趋 结 点 ; 如 果 某 结 点 不 存在 左 儿子 结 点 ， 
则 需 遍 历 二 叉 树 才能 确定 该 结 点 的 前 趋 结 点 。 

实际 上 ， 在 大 多 数 情况 下 ， 寻 找 结 点 的 前 趋 结 点 或 后 继 结 点 都 需要 遍历 二 又 树 。 

为 方便 寻找 二 叉 树 中 结 点 的 前 趋 结 点 或 后 继 结 点 ， 可 以 通过 一 次 遍历 记 下 各 结 点 在 遍 
历 所 得 的 线性 序列 中 的 相对 位 置 。 保 存 这 种 信息 的 一 种 简单 的 方法 是 在 每 个 结 点 增加 两 个 
指针 域 ， 使 它们 分 别 指向 依 某 种 次 序 遍 历时 所 得 到 的 该 结 点 的 前 趋 结 点 和 后 继 结 点 ， 显 然 
这 样 做 要 浪费 相当 数量 的 存储 单元 。 如果 仔 细 分 析 一 棵 具有 nn 个 结 点 的 二 叉 树 , 就 会 发 现 ， 
当 它 采用 二 叉 链 表 作 存储 结构 时 ， 二 叉 树 中 的 所 有 结 点 共有 n+1 个 空 指针 域 。 因 此 ， 可 以 
设法 利用 这 些 空 指针 域 来 存放 结 点 的 前 趋 结 点 和 后 继 结 点 的 指针 信息 ， 这 种 附加 的 指针 称 
为 “线索 ”。 我 们 可 以 作 这 样 的 规定 ， 当 某 结 点 的 左 指针 域 为 空 时 ， 令 其 指向 依 某 种 方式 
遍历 时 所 得 到 的 该 结 点 的 前 趋 结 点 ， 否 则 指向 它 的 左 儿 子 ， 当 某 结 点 的 右 指 针 域 为 空 时 ， 
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令 其 指 癌 依 某 种 方式 遍历 时 所 得 到 的 该 结 点 的 后 继 结 点 ， 否 则 指向 它 的 右 儿 子 。 增 加 了 线 
索 的 二 又 链表 称 为 线索 链表 ， 相 应 的 二 又 树 称 为 线索 二 又 树 (Threaded Binary Tree)。 

这 样 作 会 产生 如 下 的 问题 : 一 个 结 点 的 左 、 右 指针 量 指向 的 是 它 的 左 、 右 儿子 结 点 ， 
还 是 它 的 前 趋 结 点 和 后 继 结 点 ?为 了 区 分 一 个 结 点 的 指针 是 指向 其 儿子 的 指针 还 是 指向 其 
前 趋 或 者 后 继 的 线索 ， 可 以 在 每 个 结 点 上 增加 两 个 线索 标志 域 ltag 和 rtag， 这 样 线索 链表 


的 结 扣 结 构 为 : 
knig) log| ga| rag| aehid 


其 中 : 


左 线 索 标 志 ”ltag=0; /lchild 是 指向 结 点 的 左 儿 子 的 指针 
ltag=1; //lchild 是 指 问 结 点 的 前 趋 结 点 的 左 线索 
右 线 索 标 志 ”rtag=0; /rchild 是 指向 结 点 的 右 儿 子 的 指针 
rtag=1; //rchild 是 指 癌 结 点 的 后 继 结 点 的 右 线 索 
每 个 标志 位 令 其 只 占 一 个 bit， 这样 就 只 需 增 加 很 少 的 存储 空间 。 在 结构 示意 图 中 ， 线 
索 通常 用 虚线 表示 。 
一 柠 二 又 树 以 某 种 方式 遍历 并 使 其 变 成 线索 二 又 树 的 过 程 称 为 二 又 树 的 线索 化 。 
对 同一 柠 二 又 树 遍历 的 方式 不 同 ， 所 得 到 的 线索 树 也 不 同 ， 二 又 树 有 前 序 、 中 序 和 后 
序 3 种 遍历 方式 ， 所 以 线索 树 也 有 前 序 线索 二 叉 树 、 中 序 线索 二 叉 树 和 后 序 线索 二 又 树 3 
种 。 图 5-14(a) 所 示 的 一 棵 二 叉 树 ， 用 三 种 方式 线索 化 后 得 到 的 前 序 线索 二 又 树 、 中 序 线索 
二 义 树 和 后 序 线索 二 又 树 分 别 如 图 5-14(b)、(c)、(d) 所 示 。 
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(d) 后 序 线索 二 叉 树 


图 5-14 ”线索 三 叉 树 
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为 讨论 算法 方便 起 见 ， 通 常 在 二 又 树 中 增加 一 个 与 树 中 结 点 相同 类 型 的 头 结 点 ， 令 头 
结 点 的 信息 域 为 空 ， 其 1child 域 指向 二 又 树 的 根 结 点 ， 当 三 又 树 为 空 时 ，1child 域 值 为 空 ; 
其 rchild 域 指 向 以 某 种 方式 遍历 二 又 树 时 最 后 访问 的 结 点 ， 当 二 叉 树 为 空 时 ,rchild 域 指 问 
该 结 点 本 身 ， 同 时 令 原 来 指向 二 叉 树 根 结 点 的 头 指针 指向 该 头 结 点 ， 以 某 种 方式 遇 内 一 文 
树 时 第 一 个 被 访问 结 点 的 左 指针 域 和 最 后 一 个 被 访问 结 点 的 右 指针 域 的 值 如 果 是 线索 ， 也 
指 疝 该 头绪 点 。 

如 图 5-15 所 示 为 一 棵 添加 了 头 结 点 的 中 序 线索 二 又 树 。 





图 5-15 “带头 结 点 的 中 序 线索 二 又 树 


5.6.2 ”线索 二 又 树 上 的 运算 


下 面 以 中 序 线索 二 又 树 为 例 ， 讨 论 线索 二 又 树 的 建立 、 线 索 二 又 树 的 遍历 以 及 在 线索 
二 叉 树 上 查找 前 趋 结 点 、 查 找 后 继 结 点 、 插 入 结 点 和 删除 结 点 等 操作 的 实现 算法 。 
1. 建立 一 棵 中 序 线索 二 叉 树 


建立 线索 二 叉 树 ， 或 者 说 ， 对 二 又 树 线索 化 ， 实 质 上 就 是 遍历 一 棵 二 又 树 ， 在 过 历 的 过 
程 中 ， 检 查 当前 结 点 的 左 、 右 指针 域 是 否 为 室 ， 如 果 为 空 ， 将 它们 改 为 指 加 前 起 结 反 或 后 继 
结 点 的 线索 。 另 外 ， 在 对 一 棵 二 又 树 加 线索 时 ， 必 须 首先 申请 一 个 头 结 点 ， 建 立 头 结 扩 与 二 
叉 树 的 根 结 点 的 线索 ， 对 二 又 树 线索 化 后 ， 还 须 建 立 最 后 一 个 结 点 与 头 结 氮 之 间 的 线索 。 


2. 在 中 序 线索 二 又 树 上 寻找 任意 结 点 的 中 序 前 趋 结 拟 


对 于 中 序 线索 二 叉 树 上 的 任 一 结 点 ， 如 果 该 结 点 的 左 标志 为 1， 那 么 其 左 指针 域 所 指 
向 的 结 点 便 是 它 的 前 趋 结 点 ， 反 之 ， 奶 果 该 结 点 的 左 标志 为 0， 表 明 该 结 点 有 左 儿 子 ， 根 
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据 中 序 遍 有 历 的 定义 ， 它 的 前 趋 结 氮 是 以 该 结 所 的 堪 儿 子 为 根 结 点 的 子 树 的 最 右 结 点 ， 即 治 
着 其 左 子 树 的 右 指针 链 风 下 但 ， 当 某 结 点 的 右 标 忘 为 1 时 ， 它 就 是 所 要 找 的 前 趋 结 点 。 


3. 在 中 序 线索 二 又 树 上 寻找 任意 结 点 的 中 序 后 继 结 点 


对 于 中 序 线索 二 又 树 上 的 任 一 结 点 ， 如 果 它 的 右 标志 为 1， 那 么 其 右 指针 域 所 指向 的 
结 扣 就 是 它 的 后 继 结 点 ， 有 反之， 如 果 该 结 点 的 右 标 志 为 0， 表 明 该 结 点 有 右 儿 子 ， 在 这 种 
和 情况 下 ,由 中 序 吉 历 的 定义 可 知 , 它 的 后 继 结 点 是 以 其 右 儿 子 为 根 结 点 的 子 树 的 最 左 结 点 
即 沿 着 该 结 点 右 子 树 的 左 指针 链 向 下 找 ， 当 某 结 点 的 左 标志 为 1 时 ， 该 结 点 就 是 所 要 找 的 
后 继 结 点 。 

以 上 给 出 的 仅 是 在 中 序 线索 二 又 树 中 寻找 某 结 点 的 前 趋 结 点 和 后 继 结 点 的 算法 。 在 前 
序 线索 二 义 树 中 找 结 点 的 后 继 结 点 以 及 在 后 序 线索 二 叉 树 中 找 结 点 的 前 趋 结 点 可 以 采用 同 
样 的 方法 分 析 和 实现 。 在 前 序 线索 二 又 树 中 找 结 点 的 前 趋 结 点 和 在 后 序 线索 二 又 树 中 找 结 
点 的 后 继 结 点 的 算法 比较 复杂 ， 要 分 多 种 情况 进行 讨论 。 


4. 在 中 序 线索 二 叉 树 中 查找 值 为 x 的 结 点 


利用 在 中 序 线 索 二 义 树 上 寻找 后 继 结 点 的 算法 ， 可 以 很 容易 地 查找 线索 二 叉 树 中 的 任 
一 结 点 。 设 置 一 指针 变量 p， 开 始 时 令 p 指向 线索 二 又 树 的 根 结 点 ， 若 p 所 指 结 点 的 信息 
域 值 为 x， 则 合 找 成 功 ， 否 则 令 p 指 加 它 原 来 所 指 结 点 的 后 继 结 点 ， 继 续 检查 p 所 指 结 点 
信息 域 的 内 容 ， 如 此 重复 下 去 ， 二 至 所 指 结 点 的 信息 霹 信 为 < 或 p-bead 为 止 

5. 在 中 序 线索 二 叉 树 上 插入 结 点 


在 中 序 线索 二 叉 树 上 插入 结 点 可 以 分 为 两 种 情况 考虑 。 一 种 情况 是 将 新 结 点 插入 到 二 
又 树 中 作为 某 结 扣 的 左 儿子 结 点 ， 另 一 种 情况 是 将 新 结 点 插入 到 二 叉 树 中 作为 某 结 点 的 右 
儿子 结 后 ， 以 下 仅 讨 论 后 一 种 情况 。 

假设 指针 变量 p 指 疝 二 又 线索 树 中 的 某 结 点 ， 指 针 变 量 > 指向 要 插入 的 新 结 点 ， 新 结 
点 + 将 插入 二 叉 树 中 ， 作 为 结 点 p 的 右 儿 子 。 

若 结 点 p 的 右 子 树 为 定 ， 则 插入 过 程 很 简单 ， 如 图 5-16(a)、 所 示 ， 这 时 结 挟 上 p 
的 后 继 结 点 变 为 结 点 的 后 继 ， 结 点 p 为 结 点 > 的 前 趋 ， 结 点 > 成 为 结 点 p 的 右 儿子 。 
扩 7 插 入 对 于 结 太 原来 的 后 继 结 点 没有 任何 影响 。 . 

若 结 太 p 的 右 子 树 不 为 空 ， 则 结 点 > 插入 后 ， 结 点 p 原来 的 右 子 树 变 为 结 点 ， 的 右 子 
树 ,，p 为 + 的 前 趋 结 点 ,+ 为 p 的 右 儿 子 结 点 。 根 据 中 序 线 索 二 叉 树 的 定义 ， 这 时 还 需 修 改 
结 氮 p 原来 右 子 树 中 最 左 结 点 的 左 指针 域 ， 使 它 由 原来 的 指向 结 点 p 改 为 指向 结 点 +， 如 
图 5-16(c)、(d) 所 示 。 
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Rad 
(0) 插入 前 (d) 插入 后 
图 5-16 在 线索 二 叉 树 中 插入 结 点 





将 新 结 点 插入 到 线索 二 又 树 中 作为 菜 结 点 的 左 儿子 结 点 ， 以 及 从 线索 二 叉 树 中 删除 结 
点 的 算法 与 上 述 算法 的 分 析 设 计 方法 相 类 似 。 | 

从 上 述 算法 可 看 出 ， 往 一 棵 线索 二 叉 树 中 插入 结 点 或 者 从 一 棵 线索 二 叉 树 中 删除 结 点 
要 作 的 主要 工作 就 是 修改 一 些 指向 儿子 结 点 的 指针 和 一 些 指向 前 趋 结 点 或 后 继 结 点 的 线 
索 。 指 向 儿子 结 点 的 指针 的 修改 很 容易 ， 而 线索 的 修改 有 时 花费 的 代价 较 大 。 例 如 ， 在 上 
述 插 入 算法 中 , 当 p 有 右 儿 子 结 点 时 , 插入 结 点 + 要 修改 结 点 p 的 原来 后 继 结 点 的 左 线 索 ， 
这 时 须 首先 在 结 点 p 的 右 子 树 中 沿 左 儿子 指针 不 断 向 下 搜索 才能 找到 该 后 继 结 点 。 所 以 ， 
在 对 线索 二 叉 树 作 插 入 或 删除 操作 时 ， 也 可 采用 另 一 种 方法 ， 插 入 或 删除 时 只 修改 指向 儿 
子 结 点 的 指针 ， 然 后 对 擂 入 或 删除 后 的 二 又 树 重新 进行 线索 化 。 


5.7 加 和 一 双料 的 转换 玉树 的 存 入 结构 





本 节 讲 述 的 主要 内 容 为 树 与 二 又 树 的 转换 规则 、 和 森林 与 二 叉 树 的 转换 规则 、 树 的 遍历 
以 及 树 的 存储 结构 。 


第 5 章 树 119 


5.7.1 树 转换 为 二 又 树 


对 于 一 棵 无 序 树 ， 树 中 结 点 的 各 儿子 的 次 序 是 无 关 紧 要 的 ， 而 二 又 树 中 结 点 的 左 、 右 
儿子 结 反 是 有 区 别 的 。 为 避免 发 生 混淆 ， 我 们 约定 树 中 每 一 个 结 点 的 儿子 结 点 按 从 左 到 右 
的 次 序 顺 序 编 号 ， 也 就 是 说 ， 把 树 作 为 有 序 树 看 待 。 如 图 5-17 所 示 的 一 棵 树 ， 根 结 点 4 
有 三 个 儿子 8B、C、D， 可 以 认为 结 点 B 为 4 的 第 一 个 儿子 结 点 ， 结 点 C 为 4 的 第 二 个 儿 
子 结 点 ， 结 点 DD 为 4 的 第 三 个 儿子 结 点 。 





© @ 
图 5-17 一 般 树 


将 一 棵 树 转换 为 二 叉 树 的 方法 是 : 

(1) 树 中 所 有 相 邻 兄弟 之 间 加 一 条 连 线 ; 

(2) 对 树 中 的 每 个 结 点 ， 只 保留 它 与 第 一 个 儿子 结 点 之 间 的 连 线 ， 删 去 它 与 其 他 儿子 
结 扩 之 间 的 连 线 。 

G) 以 树 的 根 结 点 为 轴 心 ， 将 整 棵 树 顺 时 针 转 动 一 定 的 角度 ， 使 之 结构 层次 分 明 。 

可 以 证 明 ， 树 作 这 样 的 转换 所 构成 的 二 又 树 是 惟一 的 。 图 5-18(a)、(b)、(c) 给 出 了 图 
5-17 所 示 的 树 转 换 为 二 又 树 的 转换 过 程 示 意图 。 








由 
© ® "© 
G 
(a) 相 邻 兄弟 加 连 线 (b) 删 去 双亲 与 其 他 儿子 的 连 线 (c) 转换 后 的 二 叉 树 


图 5-18 ” 树 转 换 为 二 叉 树 的 过 程 


5-19 给 出 了 男 一 棵 树 及 其 转换 后 所 建立 的 二 又 树 。 通 过 转换 过 程 可 以 看 出 , 树 中 的 
任意 一 个 结 点 都 对 应 于 二 又 树 中 的 一 个 结 点 ， 树 中 某 结 点 的 第 一 个 儿子 在 二 叉 树 是 相应 结 
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cr 


点 的 左 儿子 ， 就 树 中 的 相 邻 兄弟 结 点 而 言 ， 在 二 又 树 中 后 一 个 儿子 结 点 成 为 前 一 个 儿子 络 
点 的 右 儿子 。 也 就 是 说 ， 在 二 叉 树 中 ， 左 分 支 上 的 各 结 点 在 原来 的 树 中 是 父子 关系 ， 而 石 


分 支 上 的 各 结 点 在 原来 的 树 中 是 兄弟 关系 。 由 于 树 的 根 结 点 没有 兄弟 ， 所 以 变换 后 的 一 文 
树 的 根 结 点 的 右 孩 子 始终 为 空 。 












(a) 一 棵 树 1 
图 5-19 ” 树 及 其 转换 后 的 二 又 树 


5.7.2 ”二 又 树 还 原 为 树 


树 转换 为 二 又 树 这 一 转换 过 程 是 可 逆 的 ， 可 以 依据 二 又 树 的 根 结 点 有 无 右 儿 子 结 点 ， 
将 一 棵 二 又 树 还 原 为 树 ， 具 体 方法 如 下 : 

(1) 若 某 结 点 是 其 双亲 的 左 儿 子 ， 则 把 该 结 点 的 右 儿 子 、 右 儿子 的 右 儿 子 、… 都 与 该 
结 点 的 双亲 结 点 用 线 连 起 来 ; 

(2) 删 掉 原 二 叉 树 中 所 有 的 双亲 结 点 与 右 儿子 结 点 的 连 线 ; 

(3) 整理 由 (1)、(2) 两 步 所 得 到 的 树 ， 使 之 结构 层次 分 明 。 

图 5-20 所 示 为 一 棵 二 又 树 还 原 为 树 的 过 程 示 意图 。 
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(a) 二 叉 树 (c) 删 去 与 右 儿子 连 线 (d) 还 原 后 的 树 


图 5-20” 二 叉 树 还 原 为 树 的 过 程 
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5.7.3 ”和 森林 转换 为 二 义 树 


穆 林 是 右 干 棵 树 的 集合 ， 和 森林 亦 可 用 二 又 树 表示 。 

森林 转换 为 二 又 树 的 方法 如 下 : 

(1) 将 森林 中 的 每 柠 树 转换 成 相应 的 二 又 树 ; 

(2) 第 一 棵 二 文 树 不 动 ， 从 第 二 棵 二 了 又 树 开 始 ， 依 次 将 后 一 棵 二 又 树 的 根 结 点 作为 前 
一 标 二 文 树 根 结 扣 的 右 孩 子 ， 当 所 有 的 二 又 树 连 在 一 起 后 ， 这 样 所 得 到 的 二 又 树 就 是 由 和 森 
林 转 换 得 到 的 二 又 树 。 

设 F={7T1,7T2…,Tw} 是 森林 ， 其 所 对 应 的 二 叉 树 为 B(T1,T2……,7)， 有 : 

(1) 大 =0， 即 下 为 衬 ， 那 么 下 亦 为 空 ; 

(2) 大 n>0， 则 二 又 树 的 根 结 扣 为 树 九 的 根 结 点 ， 其 左 子 树 为 B(T11,T12,…,Tim)， 其 中 
Tl，Ti2，“…*，Tinm 是 根 结 点 的 子 树 ， 而 其 右 子 树 为 MTree) \ 
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(a) 森林 G 
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是 有 轴 
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(b) 每 一 棵 树 转换 为 二 叉 树 (e) 每 一 棵 二 又 树 连接 后 的 二 叉 树 


5-21 森林 及 其 转换 为 二 又 树 的 过 程 


5.7.4 ” 树 的 遍历 


树 的 过 有 历 通常 有 两 种 方式 : 先 根 遍历 和 后 根 遍 历 。 下 面 分 别 进行 讨论 。 
1. 先 根 遍历 


先 根 授 历 的 定义 为 : 

(1) 访问 根 结 点 ; 

(2) 按照 从 左 到 右 的 顺序 先 根 遍历 根 结 点 的 每 一 棵 子 树 。 

按照 树 的 先 根 遍历 的 定义 ， 对 图 5-17 所 示 的 树 进行 先 根 遍历 ， 得 到 的 结果 序列 为 4B 
ErFCDG, 
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同样 ， 对 图 5-19(a) 所 示 的 树 进行 先 根 遍 历 ， 得 到 的 结果 序列 为 4BFGLMHCIND 
EJK. | 


2. 后 根 蜗 历 


后 根 遍 历 的 定义 为 : 

(1) 按照 从 左 到 右 的 顺序 后 根 遍历 根 结 点 的 每 一 棵 子 树 ; 

(2) 访问 根 结 点 。 / 

按照 树 的 后 根 遍 历 的 定义 ， 对 图 5-17 和 图 5-19(a) 所 示 的 树 进行 后 根 遍历 ， 得 到 的 结 
果 序 列 分 别 为 EFBCGDA、FLMGHBNICDJKEA 

事实 上 ， 根 据 树 与 二 又 树 的 转换 关系 以 及 树 和 二 叉 树 的 遍历 定义 可 以 推 知 ， 树 的 先 根 
遍历 与 其 转换 的 相应 二 又 树 的 前 序 遍 历 的 结果 序列 相同 ， 树 的 后 根 遍 历 与 其 转换 的 相应 二 
又 树 的 中 序 遍 历 的 结果 序列 相同 。 因 此 ， 树 的 遍历 算法 也 可 采用 相应 的 二 又 树 的 遍历 算法 
实现 。 


5.7.5 ”森林 的 蜗 历 


称 林 的 壳 历 有 两 种 方式 :前 序 遍历 和 中 序 遍 历 。 
1. 前 序 壳 历 


前 序 遍 历 的 定义 为 : 

(1) 访问 森林 中 第 一 棵 树 的 根 结 点 ; 

(2) 前 序 过 历 第 一 棵 树 的 根 结 点 的 子 树 森 林 ; 

(3) 前 序 志 历 剩余 的 其 他 子 森林 。 

对 于 图 5-21 所 示 的 森林 进行 前 序 遍 历 ， 得 到 的 结果 序列 为 4BCDEFGHIJK。 
2. 中 序 遍 历 


中 序 遍 历 的 定义 为 : 

(1) 中 序 壳 历 第 一 棵 树 的 根 结 点 的 子 树 森林 ; 

(2) 访问 森林 中 第 一 棵 树 的 根 结 点 ; 

(3) 中 序 吉 历 剩 余 的 其 他 子 森 林 。 | 

对 于 图 5-21 所 示 的 森林 进行 中 序 裔 历 ， 得 到 的 结果 序列 为 B4DEFCJHKIG。 
”根据 森林 与 二 又 树 的 转换 关系 以 及 森林 和 二 又 树 的 遍历 定义 可 以 推论 ， 森林 前 序 遍 历 
和 中 序 壳 历 分 别 与 所 转换 的 二 又 树 的 前 序 遍 历 和 中 序 遍 历 的 结果 序列 相同 。 
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5.7.6” 树 的 存储 结 


1. 双 杀 链表 表示 法 


以 一 组 连续 的 存储 单元 来 存放 树 中 的 结 点， 每 个 结 点 有 两 个 域 ， 一 个 是 数据 域 ， 用 来 


放 结 点 信息 , 男 一 个 是 双亲 域 , 用 来 存放 双亲 的 位 置 (指针 )。 该 结构 的 具体 描述 如 图 5-22 
不 。 
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(a) 树 (b) 树 的 双亲 链表 表示 法 


图 5-22” 树 的 双亲 链表 表示 法 示意 


2. 孩子 链表 表示 法 


将 一 个 结 反 所 有 孩子 链接 成 一 个 单 链表 形 , 而 树 中 有 若干 个 结 点 , 则 有 若干 个 单 链表 ， 
每 个 单 链表 有 一 个 表 头 结 点 ， 所 有 表 头 结 点 用 一 个 数组 来 描述 ， 具 体 描述 如 图 5-23 所 示 。 
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5-23 ” 树 的 孩子 链表 表示 法 (图 5-20(a) 中 树 ) 示 意 


3. 双 杀 孩子 链表 表示 法 
双亲 孩子 链表 表示 法 的 具体 描述 如 图 5-24 所 示 。 
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5-24 树 的 双 杀 孩子 链表 表示 法 (图 5-20(a) 中 树 ) 示 意 


4. 孩子 兄弟 链表 表示 法 


类 似 于 二 又 链 表 , 但 第 一 根 链 指 癌 第 一 个 孩子 , 第 二 根 链 指 向 下 一 个 兄弟 ,将 图 5-21(a) 
的 树 用 孩子 兄弟 链表 表示 法 表示 ， 如 图 5-25 所 示 。 
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5-25” 树 的 孩子 兄弟 链表 表示 法 (图 5-20(a) 中 树 ) 示 意 


5.8” 哈 夫 曼 树 及 其 应 用 


本 市 讲述 的 主要 内 容 为 哈 夫 曼 树 的 基本 概念 以 及 哈 夫 曼 树 的 两 种 应 用 : 编码 问题 和 判 
定 问 题 。 
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5.8.1 ”了 哈 夫 军 树 的 基本 概念 


1， 路 径 和 路 径 长 度 


在 一 株 树 中 ， 从 一 个 结 点 往 下 可 以 达到 的 孩子 或 子孙 结 点 之 间 的 通路 ， 称 为 路 径 。 通 
路 中 分 支 的 数目 称 为 路 径 长 度 。 
若 规 定 根 结 点 的 层 数 为 1， 则 从 根 结 点 到 第 工 层 结 点 的 路 径 长 度 为 L- 1。 


2. 结 扣 的 权 及 带 权 路 径 长 度 


各 将 树 中 结 氮 赋 给 一 个 有 着 某 种 含义 的 数值 ， 则 这 个 数值 称 为 该 结 点 的 权 。 
结 点 的 带 权 路 径 长 度 为 ， 从 根 结 点 到 该 结 点 之 间 的 路 径 长 度 与 该 结 点 的 权 的 乘积 。 
3. 树 的 带 权 路 径 长 度 


树 的 市 权 路 径 长 度 规 定 为 所 有 叶子 结 点 的 带 权 路 径 长 度 之 和 ， 记 为 WPL。 
4. 最 优 二 又 树 


最 小 ， 称 这 样 的 二 又 树 为 最 优 二 义 树 ， 也 称 为 哈 夫 曼 树 。 


5. 险 夫 曼 树 的 构造 


假设 有 n 个 权 值 , 则 构造 出 的 哈 夫 曼 树 及 个 叶子 结 点 。n 个 权 值 分 别 设 为 所 、 押 、…、 
W,， 则 哈 夫 曼 树 的 构造 规则 为 : 

(1) 将 所 、 瑟 、…、W, 看 成 是 有 nn 棵 树 的 森林 (每 棵 树 仅 有 一 个 结 点 )，; 

(2) 在 森林 中 选 出 两 个 根 结 点 的 权 值 最 小 的 树 合并 ， 作 为 一 棵 新 树 的 左 、 右 子 树 ， 且 
新 树 的 根 结 点 权 值 为 其 左 、 右 子 树 根 结 点 权 值 之 和 ; 

(3) 从 森林 中 删除 选取 的 两 棵 树 ， 并 将 新 树 加 入 森林 ; 

(4) 重复 (2)、(3) 步 ， 直 到 森林 中 只 剩 一 棵 树 为 止 ， 该 树 即 为 我 们 所 求 得 的 哈 夫 曼 树 。 

哈 夫 曼 树 的 构造 过 程 示意 如 下 : 假设 给 定 的 叶子 结 点 的 权 分 别 为 1、5、7、3， 则 构造 
哈 夫 曼 树 的 过 程 如 图 5-26 所 示 。 从 图 5-26 可 知 ，n 个 权 值 构造 蛤 夫 曼 树 需 n - 1 次 合并 ， 
每 次 合并 ， 森 林 中 的 树 数目 减 1， 最 后 森林 中 只 剩 下 一 棵 树 ， 即 为 求 得 的 哈 夫 曼 树 ， 
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(a) 初始 森林 (b) 一 次 合并 后 的 森林 





cl \ 
全 全 





(c) 二 次 合并 后 的 森林 (d) 三 次 合并 后 的 森林 
图 5-26 ” 哈 夫 曼 树 的 构造 过 程 


哈 夫 曼 树 类 的 声明 如 下 : 


class LettFreq{ / 叶 结 点 与 权 值 对 
private char lett; // 叶 结 点 
private int freq; // 权 值 


public LettFreq(int f, char 1) {freq=f:; lett=]:} 

public LettFreq(int f) {freq=f:} 

public int weight() {return freq;1}// 返 回 权 值 

public char letter() {return lett;}// 返 回 叶 结 点 
}class LettFreq 


class HuffTree{ // 哈 夫 曼 编码 树 
private BinNode root; // 哈 夫 曼 编码 树 根 结 点 
public HuffTree(LettFreq val) 
{root = new BinNodePtr(val);} 
public HuffTree(LettFreq val, HuffTree 1, HuffTree r) 
{root = new BinNodePtr(val, 1.root(), r.root());} 


public BinNode root(){ return root;} 

public int weight() // 根 结 点 的 权 值 即 是 树 的 权 值 
{ return ((LettFreq)root.element()).weight(); } 
}//class HuffTree 


5.8.2 ”了 哈 夫 受 树 在 编码 问题 中 的 应 用 


在 数据 通信 中 ， 经 常 需要 将 传送 的 文字 转换 成 由 二 进 制 字符 0、1 组 成 的 二 进 制 串 ， 
我 们 称 之 为 二 进 制 编码 。 在 发 送 端 , 需要 将 电文 中 的 字符 转换 成 二 进 制 的 0、! 序列 (编码 )， 
而 在 接收 端 则 要 将 收 到 的 0、1 序列 转换 成 对 应 的 字符 序列 ( 译 码 )。 
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最 简单 的 编码 方式 是 等 长 编码 ， 例 如 如 果 电 文 是 英文 ， 则 电文 的 字符 串 由 26 个 英文 
字母 组 成 ， 需 要 编码 的 字符 集合 是 {A,B,…;Z}。 采 用 等 长 的 二 进 制 编码 时 ， 每 个 字符 用 五 
位 二 进 制 位 串 表示 即 可 (2 >26)。 在 接收 端 , 只 要 按 五 位 分 割 进 行 译 码 就 可 得 到 对 应 的 字符 。 

险 夫 曼 树 可 用 于 构造 使 电文 的 编码 总 长 最 短 的 编码 方案 。 具 体 作法 如 下 ， 设 需要 编码 
的 字符 集合 为 {di,d;,,…*,d,}， 而 它们 在 电文 中 出 现 的 次 数 或 频率 集合 为 {wi,w2,…,w,}， 以 
di,d2,…,dn 作为 叶 结 点 ，wi,w2,…,w 作为 它们 的 权 值 构造 一 棵 哈 夫 曼 树 ， 规定 哈 夫 曼 树 中 的 
左 分 文 代表 0， 右 分 支 代表 1， 则 从 根 结 点 到 每 个 叶 结 点 所 经 过 的 路 径 分 支 组 成 的 0 或 1 
序列 便 为 该 结 点 对 应 字符 的 编码 ， 称 之 为 哈 夫 曼 编 码 。 

在 哈 夫 曼 编码 树 中 ， 树 的 带 权 路 径 长 度 的 含义 是 各 个 字符 的 码 长 与 其 出 现 次 数 的 乘积 
和 ,也 就 是 电文 的 代码 总 长 。 显然 ,因为 哈 夫 曼 算法 构造 的 是 带 权 路 径 长 度 最 小 的 二 叉 树 ， 
所 以 采用 哈 夫 曼 树 构造 的 编码 是 一 种 能 使 电文 代码 总 长 最 短 的 不 等 长 编码 ， 

在 建 立 不 等 长 编码 时 ， 必 须 使 任何 一 个 字符 的 编码 都 不 是 另 一 个 字符 编码 的 前 缀 ， 这 
样 才 能 保证 译 码 的 惟一 性 。 例 如 ， 若 字符 A 的 编码 为 01; 字符 BB 的 编码 为 010， 那 么 字符 
A 的 编码 就 成 了 字符 B 的 编码 的 前 级 ， 这 时 对 于 代码 串 01010…… ， 在 译 码 时 就 无 法 判定 
征 将 前 两 位 码 01 译 为 字符 A， 还 是 将 前 三 位 码 010 译 为 字符 B。 在 哈 夫 曼 树 中 ,由 于 每 个 
子 符 结 瓜 都 是 叶 结 点 ， 它 们 不 可 能 在 根 结 点 到 其 他 字符 结 点 的 路 径 上 ， 所 以 二 个 字符 的 哈 
六 受 编码 不 可 能 是 另 一 个 字符 的 哈 夫 曼 编码 的 前 级 ， 从 而 保证 了 译 码 的 非 三 义 性 ， 

例如 ， 设 组 成 电文 的 字符 集 九 及 其 概率 分 布 WW 为 : 


D={a,b,c,d,e} 
W={0.12,0.40,0.15,0.08,0.25)} 


用 哈 夫 曼 算 法 构造 的 哈 夫 曼 树 及 其 对 应 的 哈 夫 曼 编 码 如 图 .5-27 所 示 。 





(a) 哈 夫 曼 编 码 树 (b) 哈 夫 曼 编码 


图 5-27 哈 夫 曼 编码 树 及 其 对 应 的 哈 夫 曼 编码 
下 徊 讨论 实现 哈 夫 曼 编码 的 算法 。 


实现 哈 夫 曼 编码 的 算法 可 分 为 两 大 部 分 ， 构 造 哈 夫 曼 树 和 在 哈 夫 曼 树 上 求 叶 结 点 的 编 
所 。 在 构造 哈 夫 曼 树 时 ， 可 以 设置 一 个 结构 数组 huff_node 保存 哈 夫 曼 树 中 各 结 点 的 信息 ， 
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根据 二 又 树 的 性 质 可 知 ,具有 nn 个 叶 结 把 的 哈 夫 曼 树 共有 2n - 1 个 结 操 ,所 以 数组 huff_node 
外 六 小 苔 置 为 2n - 1， 数组 元 素 的 结构 形式 如 下 : 


ig] oa] ea roa] pac 


其 中 weight 域 保存 结 点 的 权 值 ，lchild 和 rchild 域 分 别 保存 该 结 点 的 左 、 右 孩子 结 点 
在 数组 huff node 中 的 序号 ， 从 而 建立 起 结 点 之 间 的 关系 。 为 了 判定 一 个 结 点 是 否 已 加 入 
了 要 建立 的 哈 夫 曼 树 中 ， 设 置 了 一 个 标志 域 fag， 当 flag=0 时 ， 表 示 该 结 点 未 加 入 树 中 ， 
当 flag 二 1 时 ， 则 表示 该 结 点 已 加 入 树 中 。 : 

在 求 各 字符 的 编码 时 ， 要 从 叶 结 点 回 退 到 根 结 点 ， 因 此 需 设 置 一 个 parent 域 ， 用 来 保 
存 结 点 的 双亲 结 点 在 huff node 数组 中 的 序号 。 

构造 哈 夫 曼 树 时 ， 首 先 将 由 n 个 字符 形成 的 个 叶 结 点 存放 到 数组 huff node 的 前 
个 分 量 中 ， 然 后 根据 哈 夫 曼 算 法 的 基本 思想 ， 不 断 将 小 子 树 合并 为 较 大 的 子 树 ， 每 次 所 构 
成 的 新 子 树 的 根 结 点 顺序 放 到 huff node 数组 中 的 前 n 个 分 量 的 后 面 。 

求 哈 夫 曼 编 码 ， 实 质 上 就 是 从 叶 结 点 开始 ， 沿 结 点 的 双亲 链 域 回 退 到 根 结 点 ， 每 回 退 
一 步 ， 就 走 过 了 哈 夫 曼 树 中 的 一 个 分 支 ， 从 而 得 到 一 位 哈 夫 曼 码 值 ， 由 于 一 个 字符 的 哈 夫 
曼 编码 是 从 根 结 点 到 相应 叶 结 点 所 经 过 的 路 径 上 各 分 支 组 成 的 0、1 序列 , 因此 先 得 到 的 分 
支 代码 为 所 求 编码 的 低位 码 ， 后 得 到 的 分 支 代码 为 所 求 编码 的 高 位 码 。 可 以 设置 一 结构 数 
组 huff_code 用 来 存放 各 字符 的 哈 夫 曼 编码 信息 ， 数 组 元 素 的 形式 如 下 : 


bits | sen 


其 中 分 量 bits 为 一 维 数组 ， 用 来 保存 字符 的 哈 夫 曼 编 码 ，start 表示 该 编码 在 数组 bits 
中 的 开始 位 置 ， 所 以 对 于 第 i 个 字符 ， 它 的 哈 夫 曼 编码 存放 在 huff codefij.bits 中 的 从 
huff code.start 到 的 分 量 上 。 





思考 和 练习 


(1) 者 一 棵 树 中 度 为 1 的 结 点 有 ni 个 ， 度 为 2 的 结 点 有 ny 个 ，…… ， 度 为 m 的 结 点 有 
nm 个 ， 它 有 多 少 个 叶 结 点 ? 

(2) 找 出 所 有 的 二 叉 树 ， 其 结 点 在 下 列 两 种 次 序 下 恰好 都 以 同样 的 顺序 出 现 :， 

e 先 根 和 中 根 

e 先 根 和 后 根 

e 中 根 和 后 根 | / 

(3) 设计 一 个 算法 ， 根据 一 个 二 又 树 结 者 点 的 先 根 序列 和 中 根 序列 构造 出 该 二 叉 树 。 假 
设 二 又 树 是 链接 表示 的 ， 并 且 任 意 两 个 结 点 的 数据 字段 值 都 不 同 。 
“”“ (4) 设计 一 个 算法 ， 将 一 个 链接 表示 的 二 叉 树 中 每 个 结 点 的 左 、 右 儿子 位 置 交换 。 
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(5) 设计 一 个 复 法 ， 按 层次 顺序 输出 二 叉 树 中 的 所 有 结 点 ， 要 求 同 一 层 上 的 结 点 从 左 
到 右 输 出 。 

(6) 议 玉 是 一 个 森林 ，B 是 与 已 对 应 的 二 叉 树 。 试 问 ,， FF 中 非 叶 结 点 的 个 数 和 B 中 夸 
子 树 为 空 的 结 点 的 个 数 之 间 有 什么 数量 关系 ? 

(7) 将 图 5-28 所 示 树 转换 为 二 又 树 。 





图 5-28 题 7 图 


(8) 与 一 个 列 出 二 叉 树 中 所 有 叶 结 点 的 函数 。 

(9) 写 一 个 递归 函数 找 出 二 叉 树 中 最 长 路 径 的 长 度 。 

(10) 号 一 个 计算 二 又 树 中 所 有 结 点 个 数 的 函数 。 

(11) 判断 真 假 : 

e 树 中 结 点 的 深度 等 于 它 的 祖先 的 个 数 。 

子 树 的 大 小 等 于 该 子 树 的 根 结 点 的 后 代数 。 

如 果 x 是 y 的 后 代 ， 则 xx 的 深度 大 于 vy 的 深度 。 

如 果 x 的 深度 大 于 y 的 深度 ， 则 x 是 y 的 后 代 。 

一 标 树 是 单 结 点 树 ， 当 且 仅 当 它 的 根 是 一 个 叶子 结 点 。 

一 个 结 点 的 祖先 数 等 于 它 的 深度 。 

如 果 R 是 S$ 的 子 树 ，S 是 7 的 子 树 ， 则 RR 是 7 的 子 树 。 

一 个 结 点 是 叶子 结 点 当 且 仅 当 它 的 度 是 0。 

在 任意 一 棵 树 中 ， 内 部 结 点 的 数目 一 定 少 于 叶子 结 点 的 数目 。 
一 棵 树 是 满 的 ， 当 且 仅 当 它 的 叶子 结 点 位 于 相同 的 层 上 。 

满 二 又 树 的 每 棵 子 树 也 是 满 树 。 

满 二 又 树 的 每 棵 子 树 也 是 完全 树 。 

如 有 果 一 棵 二 叉 树 的 所 有 叶子 结 点 都 处 于 同 层 ， 这 棵 二 又 树 是 满 二 又 树 。 
如 果 二 又 树 的 结 点 数 为 n， 高 度 为 h”， 则 有 有 h > | log," | 

e 二 勾 树 的 深度 为 dq， 则 其 最 多 有 24 个 结 点 。 

e 如 采 一 棵 二 又 树 的 每 个 合法 的 子 树 都 是 满 二 又 树 ， 则 这 棵 二 又 树 本 身 是 满 二 叉 树 。 
(12) 哪 一 种 遍历 方式 总 是 : 

e 首先 访问 根 结 点 ? 
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e 位 于 最 左边 的 结 点 最 先 访问 ? 

e 根 最 后 访问 ? 

e 最 右边 的 结 点 最 后 访问 ? 

(13) 一 棵 高 度 为 9 的 满 二 又 树 : 

e 有 多 少 个 叶子 结 点 ? 

e 有 多 少 个 中 间 结 点 ? 

e 有 和 多少 个 结 点 ? | 

(14) 给 出 一 棵 结 点 数 n=100 的 二 又 树 可 能 的 高 度 范围 。 

(15) 对 于 一 般 树 为 什么 没有 中 序 遇 历 ? 

(16) 高 度 为 4 的 二 叉 树 的 结 点 数 半 所 处 的 区 间 是 多 少 ? 

(17) 结 点 数 为 7 的 二 叉 树 的 高 度 有 所 处 的 区 间 是 多 少 ? 

(18) 给 定 的 二 义 树 的 结 点 数 ， 要 使 树 高 最 大 ， 树 应 该 是 什么 形状 ? 要 使 树 高 最 小 ， 树 
又 应 该 是 什么 形状 ? 

(19) 试 画 出 大 小 n=5 的 所 有 42 棵 二 又 树 。 

(20) 大 小 n=6 的 不 同 二 叉 树 有 多 少 棵 ? 

(21) 如 果 用 Am 表示 大 小 为 于 的 二 叉 树 的 数目 ， 记 推 导出 及 四 的 条 不 关 系 。 

(22) 给 出 高 度 为 严 的 完全 二 叉 树 的 数目 Rh) 的 计算 公式 。 

(23) 给 出 高 度 为 h 的 满 二 又 树 的 数目 A 有) 的 计算 公式 。 

(24) 证 明 满 二 又 树 的 每 棵 子 树 也 都 是 满 二 叉 树 。 

(25) 证 明 完 全 二 又 树 的 每 棵 子 树 也 都 是 完全 二 叉 树 。 
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图 是 非 线 性 数据 结构 。 图 中 任何 两 个 项 后 都 可 能 有 关联 ， 顶 后 间 的 关系 是 多 对 多 的 关 
系 ， 这 种 关系 在 现实 世界 中 大 量 存 在 。 


本 草 的 学 习 目 标 : 

e 图 的 概念 ; 

e 图 的 存储 结构 ; 

e 图 的 过 历 ; 

e 生成 树 和 最 小 生成 树 ; 
e 最 短路 径 和 拓扑 排序 。 


6.1 图 的 基本 概念 





本 节 讲 述 的 主要 内 容 为 图 的 定义 以 及 图 的 常用 术语 。 
6.1.1 图 的 定义 


1. 图 的 定义 


图 可 用 二 元 组 表示 : G=(V,E)， 其 路 表示 元 素 (顶点 ) 的 非 空 有 限 集合 E 表示 元 素 之 
间 关 系 ( 边 ) 的 有 限 集 集合 ， 边 是 顶点 偶 对 。 可 以 看 出 图 的 每 个 结 点 有 任意 多 个 前 趋 和 后 继 


2. 有 向 图 和 无 向 图 


如 果 图 的 边 限定 为 从 一 个 顶点 指向 另 一 个 顶点 ， 即 每 条 边 都 是 顶点 的 有 序 偶 对 ， 称 之 
为 有 向 图 。 如 果 图 中 的 边 没 有 方向 性 ， 即 每 条 边 都 是 顶点 的 无 序 偶 对 ， 称 之 为 无 向 图 。 如 
图 6-1 表示 一 个 有 网 图 和 无 向 图 。 

这 里 ， 有 向 图 中 <1,2> 和 <2,1> 表 示 两 个 不 同 的 方向 边 。 以 <1,2> 为 例 ， 在 <1.2> 中 : 1 称 
为 此 边 的 起 点 或 尾 ( 孤 尾 )，2 称 为 此 边 的 终点 或 头 ( 孤 头 )。 边 的 方向 规定 为 孤 尾 一 > 孤 头 。 

而 无 向 图 中 (1,2) 和 (2,1) 代 表 同 一 边 。 
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(a) 有 向 图 Gl 
V(G1)={1,2,3,4} 顶 点 集合 ; 
E(G1)={<1,2>,<1,3>,<3,4>,<4,1>} 边 的 集合 


e 一 


(b) 无 同 图 G2 
VG2)={1,2,3,4,5} 顶 点 集合 ; 
E(G2)={(1,2)，(1,4)，(2,3)，(2,5)，(3,4)，(3,5)} 边 的 集合 


图 6-1 有 加 图 和 无 回 图 







3. 于 图 


若 G 和 G' 是 两 个 图 ， 且 存在 看 VG)c VG) 和 E(G”)cE(G) 的 关系 ， 则 称 G' 是 G 的 子 
图 。 如 图 6-2 表示 图 与 子 图 。 








(b) 图 6-1 中 无 向 图 G2 的 子 图 示例 
图 6-2 有 向 图 、 无 向 图 及 其 子 图 


6.1.2 弟 用 术语 


在 一 个 有 nn 个 项 扣 的 无 同 图 中 ,者 每 个 项 点 到 其 他 nn- 1 顶点 都 有 一 条 边 ， 则 图 中 及 n 
个 顶点 且 有 n*(n - 1)/2 条 边 的 图 称 为 无 向 完全 图 。 若 为 有 向 完全 图 ， 则 边 应 为 n*(n - 1)。 
可 见 在 无 向 完全 图 中 ， 任 意 两 点 之 间 均 有 边 ; 在 有 向 完全 图 中 ， 任 意 两 顶点 之 间 均 有 方向 
相反 的 两 条 弧 。 
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6-3 中 ， 顶 点 数 =4， 边 数 =4*(4 - 1)/2=6。 可 以 看 到 ， 图 A 
中 每 个 顶点 到 其 他 三 个 顶点 都 有 一 条 边 相连 。 ne 


六 


2， 邻接 点 `/ 奏 \ 


对 无 向 图 G<(E)， 车 有 (V1,V2)eE， 则 称 V1 和 2 互 为 Gr 一 
邻接 点 。 如 图 6-3 中 ， 结 点 4 的 邻接 点 有 1、2、3， 称 1 和 4、 图 6-3 无 向 完全 图 
2 和 4 互 为 邻接 点 。 


3. 相关 边 


两 个 相 邻 接 的 点 连 成 的 边 叫 做 这 两 个 结 点 的 相关 边 。 如 图 6-3 中 ， 与 结 点 4 相关 联 边 
有 (1,4)、(2,4) 和 (3,4)。 


4. 度 


与 每 个 项 点 相连 的 边 的 数 叫 该 点 的 度 。 如 图 6-3 中 ， 顶 点 4 的 度 为 3， 其 他 各 点 度 也 
均 为 3。 


5. 入 度 


对 有 问 图 中 系 结 点 的 孤 头 数 ( 边 的 终点 ) 称 为 该 结 点 的 入 度 。 如 图 6-1(a) 有 向 图 G1 中 ， 
绍 扩 4 的 入 度 为 1， 因为 只 有 结 点 3 指向 它 。 


6. 出 度 


对 有 同 图 中 某 结 点 的 孤 尾数 ( 边 的 终点 ) 称 为 该 结 点 的 出 度 。 对 于 有 向 图 ， 有 度 = 入 度 + 
出 度 。 如 图 6-1(a)Y 有 问 图 G1 中 ， 结 点 4 的 出 度 为 1 “因为 它 只 指向 结 点 1。 
7. 路 径 


在 一 图 中 者 从 菜 个 顶点 Vp 出 发 ， 沿 着 一 些 边 经 过 顶点 甩 , 成 ,…*，V 到达 .WV 则 称 顶 
扩 序 列 (Vp, 克 ,2…,Vm,Ve) 为 从 Vp 到 Vs 的 路 径 ， 其 中 志 是 路 径 的 始点 ，V 是 路 径 的 终点 。 
如 图 6-1(b) 无 各 图 G2 中 ， 从 1 到 5 的 路 径 为 1、4、3、5 或 1、2、5。 

对 于 有 同 图 路 径 也 是 有 向 的 ， 路 径 的 方向 总 从 起 点 到 终点 ， 且 与 它 经 过 的 每 条 边 的 方 
同一 致 。 

”路 人 径 上 的 边 或 弧 的 数目 称 之 为 该 路 径 的 长 度 。 
除 始 点 和 终点 外 ， 其 他 各 顶点 均 不 同 的 路 径 称 之 为 简单 路 径 。 
8. 回路 


从 一 顶点 出 发 又 回 到 该 项 点 ， 则 所 经 过 的 路 径 ( 即 始点 和 终点 相同 的 路 径 ) 称 为 回路 。 
始 扣 和 终点 相同 的 简单 路 径 称 之 为 简单 回路 。 
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9. 有 关连 通 的 概念 


连通 : 在 无 向 图 中 ,， 若 从 顶点 万 到 顶点 态 之 间 有 路 径 则 称 这 两 个 顶点 是 连通 的 。 如 图 
6-1(b) 无 向 图 G2 中 ， 顶 点 1 到 顶点 5 是 有 路 径 的 ， 所 以 是 连通 的 。 

连通 图 : 如 果 图 中 任意 一 对 顶点 之 间 都 是 连通 的 ， 则 称 此 图 为 连通 图 。 如 图 6-1(b) 无 
向 图 G2 中 ， 因 为 任意 两 点 均 连 通 ， 所 以 G2 是 一 个 连通 图 。 

连通 分 量 : 非 连通 图 中 的 每 一 个 连通 部 分 叫 连通 分 量 。 无 回 图 及 其 3 个 连通 分 量 如 图 
6-4 所 示 。 





6-4 无 问 图 及 其 三 个 连通 分 量 


强 连通 ， 对 于 有 向 图 ， 若 从 顶点 态 到 顶点 万 到 顶点 及 之 间 都 有 路 径 ， 则 称 这 两 点 是 
强 连通 的 。 如 图 6-1(a) 有 向 图 G1 中 ， 顶 点 1 和 顶点 3 是 强 连通 的 。 
强 连 通 图 : 如 果 有 向 图 中 任何 一 对 顶点 都 是 强 连通 的 ， 则 此 图 叫 强 连通 图 。 如 图 6-5 
所 示 ， 此 图 不 是 强 连通 图 ， 因 为 顶点 2 到 其 他 顶点 不 存在 路 径 。 
强 连 通 分 量 ， 有 向 图 中 最 大 连通 子 图 称 为 有 向 图 的 强 连通 分 量 。 如 图 6-5 为 图 6-1(a) 
有 向 图 G1 的 两 个 强 连通 分 量 。 
10. 权 和 带 权 图 (网 或 者 网 络 ) 


权 : 有 些 图 对 应 每 条 边 有 一 相应 的 数值 ， 这 个 数值 称 为 该 边 的 权 。 

网 带 权 的 图 称 为 网 。 网 可 分 为 有 疝 网 和 无 癌 网 。 

不 同 网 络 的 权 有 不 同 的 意义 : 电网 络 权 可 以 是 阻抗 , 运输 网 络 中 的 权 可 以 是 路 程 长 度 、 
运费 等 。 和 市 权 图 如 图 6-6 所 示 。 





图 6-5” 强 连通 分 量 图 6-6 网 络 (市 权 图 ) 
(每 条 边 上 的 数字 束 是 该 边 的 权 ) 
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6.2 ”图 的 存储 结构 








本 蔬 讲 述 的 主要 内 容 为 图 的 邻接 矩阵 表示 法 和 邻接 表 表 示 法 。 

为 了 便于 计算 机 处 理 图 的 问题 ， 需 要 把 图 的 各 顶点 间 的 连接 关系 输入 到 计算 机 。 只 有 
采用 计算 机 容易 接受 和 处 理 的 数据 结构 来 表示 图 ， 才 能 有 利于 计算 机 进行 运算 。 

对 具体 的 图 而 言 ， 最 好 的 存储 结构 不 仅 依 赖 于 数据 的 性 质 ， 而 且 也 依赖 于 在 这 些 数据 
上 所 实施 的 操作 。 恰 当地 选择 存储 结构 也 受到 其 他 一 些 因 素 的 影响 。 例 如 ， 顶点 的 数目 、 
度 的 平均 数 、 有 向 图 还 是 无 向 图 等 。 


6.2.1 ”邻接 矩阵 表示 法 


邻接 和 矩阵 是 用 来 表示 图 中 顶点 之 间 的 邻接 关系 的 和 矩阵。 邻接 矩阵 是 ， 

设 G=(W, 忆 是 具有 n 个 顶点 的 图 ， 则 G 的 邻接 矩阵 是 一 个 n*n 的 方 阵 ， 其 中 矩阵 每 一 
行 分 别 对 应 图 的 各 个 顶点 ;和 矩阵 的 每 一 列 分 别 对 应 图 的 各 个 顶点 。 

规定 矩阵 元 素 


l 对 无 同 图 存在 (v，， vy ) 边 ， 对 有 了 向 图 存在 <v， v > 边 
54。 |0 不 存在 边 


对 于 无 问 图 ， 其 邻接 矩阵 是 对 称 的 ， 上 Ui Ajio 图 6-1 中 图 Gl 和 和 G2 的 邻接 矩阵 分 
别 为 : 


2 
加 一 
避 一 避 性 


0 
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B=10 
1 
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和 
一 
DD 

人 


0 


右 图 的 各 边 是 带 权 的 , 即 图 为 网 络 时 , 用 边 ( 弧 ) 的 权 值 w 作为 邻接 矩阵 对 应 元 素 的 值 ， 
定义 如 下 : 


ws; 对 无 向 图 存在 (VY,, vj ) 边 ， 对 有 向 图 存在 < wy > 边 
六 co 或 者 0 ”不 存在 边 


对 于 无 向 网 ， 其 邻接 矩阵 是 对 称 的 ， 即 w=ar。 图 6-6 所 示 无 向 网 络 的 邻接 矩阵 为 ， 
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OO OO nh 
中 iD ww ~ 人] 
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je 
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邻接 矩阵 的 性 质 ， 

(1) 图 中 各 项 点 序号 确定 后 ， 图 的 邻接 矩阵 是 惟一 确定 的 ， 

(2) 无 向 图 和 无 向 网 的 邻接 矩阵 是 一 个 对 称 矩 阵 ; 

(3) 无 向 图 邻接 矩阵 中 第 : 行 (或 第 列 ) 的 非 0 元 素 的 个 数 即 为 第 i 个 顶点 的 度 ; 

(4) 有 向 图 邻接 矩阵 第 i 行 非 0 元 素 个 数 为 第 i 个 顶点 的 出 度 ， 第 i 列 非 0 元 素 个 数 为 
第 i 个 顶点 的 入 度 ， 第 i 个 顶点 的 度 为 第 i 行 与 第 i 列 非 0 元 素 个 数 之 和 ; 

(5) 无 向 图 的 边 数 等 于 邻接 矩阵 中 非 0 元 素 个 数 之 和 的 一 半 ， 有 向 图 的 弧 数 等 于 邻接 
矩阵 中 非 0 元 素 个 数 之 和 。 

需要 说 明 的 是 : 

(1) 邻接 和 矩阵 表示 法 对 于 以 图 的 顶点 为 主 的 运算 比较 适用 | 

(2) 除 完全 图 外 ， 其 他 图 的 邻接 矩阵 有 许多 零 元 素 ， 特 别 是 当 n 值 较 大 ， 而 边 数 相对 
完全 图 的 边 n - 1 又 少 得 多 时 ， 则 此 抢 阵 称 为 “稀疏 和 矩阵”， 其 浪费 存储 空间 。 


6.2.2 ”邻接 表 表 示 法 


邻接 表 是 图 的 一 种 链接 存储 结构 。 在 邻接 表 表 示 法 中 ， 用 一 个 顺序 存储 区 来 存储 图 中 
各 顶点 的 数据 ， 并 对 图 中 每 上 顶点 v; 建 立 一 个 单 链表 (此 单 链表 称 之 为 六 的 邻接 表 )， 把 顶 
点 的 所 有 相 邻 顶点 ， 即 其 后 继 顶 点 的 序号 链接 起 来 。 邻 接 表 中 的 每 一 个 结 点 ( 边 表 结 点 ) 
均 包含 有 两 个 域 , 都 接点 域 和 指针 域 。 邻 接点 域 用 于 存放 与 顶点 w 相 邻接 的 一 个 顶点 的 序 
号 ， 指 针 域 用 于 指向 下 一 个 边 表 结 点 。 每 个 顶点 v; 除 设置 存储 本 身 数据 外 ， 还 设置 了 指针 
域 ， 作 为 邻接 表 的 表 头 指针 。n 个 顶点 用 一 维 数组 表示 。 


邻接 表 结 点 ，_ 图 的 顶点 : : 


在 无 问 图 的 邻接 表 中 ， 顶 点 六 的 每 一 个 边 表 结 点 对 应 于 与 vi; 相关 联 的 一 条 边 ; 而 在 有 
问 图 的 邻接 表 中 ，v; 的 每 一 个 边 表 结 点 对 应 于 以 vj 为 始点 的 一 条 张 ， 因 此 也 称 有 向 图 的 邻 
接 表 的 边 表 为 出 边 表 。 这 样 ， 在 有 向 图 的 邻接 表 中 求 第 i 个 顶点 的 出 度 很 方便 ， 即 为 第 i 
个 出 边 表 中 结 扣 的 个 数 ， 但 是 如 果 要 求 求 第 i 个 顶点 的 入 度 则 必须 遍历 整个 表 。 考 虑 在 有 
问 图 的 邻接 表 中 ， 将 顶点 vi; 的 每 个 边 表 结 点 对 应 于 以 vi 为 终点 的 一 条 缠 ， 即 用 边 表 结 点 的 
邻接 氮 域 存储 邻接 到 六 的 顶点 的 序号 ， 由 此 构成 的 邻接 表 称 为 有 向 图 的 道 邻接 表 ， 逆 邻接 
表 有 边 表 称 为 入 边 表 。 这 样 在 逆 邻 接 表 中 求 菜 顶点 的 入 度 与 在 邻接 表 中 求 顶点 的 出 度 一 样 
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方便 。 
对 于 网 络 ， 则 只 需要 在 以 上 边 表 结 点 的 结构 中 增设 一 权 值 域 。 
邻接 表 与 邻接 矩阵 的 关系 如 下 : 


(1) 对 应 于 邻接 矩阵 的 每 一 行 有 一 个 线形 链接 表 ; 

(2) 链接 表 的 表 头 对 应 着 邻接 矩阵 该 行 的 顶点 ， 

(3) 链接 表 中 的 每 个 结 点 对 应 着 邻接 矩阵 中 该 行 的 二 个 非 零 元 素 ; 
(4) 对 于 无 向 图 ， 一 个 非 零 元 素 表示 与 该 行 顶点 相 邻接 的 另 一 个 顶点 ; 
(5) 对 于 有 向 图 ， 非 零 元 素 则 表示 以 该 行 项 点 为 起 点 的 一 条 边 的 终点 。 
邻接 表 表 示 法 示例 如 图 6-7 所 示 。 





顶点 表 一 入 边 表 
(a) 图 6-1(a) 有 向 图 G1 的 邻接 表 (b) 图 6-1(a) 有 同 图 G1 的 逆 邻 接 表 





组 -= 2 
一 
让 要 [A 
Ee 和 

人 一 本 到 

顶点 表 边 表 


(9 图 6-1(b) 有 疝 图 G2 的 邻接 表 
图 6-7 有 向 图 和 无 向 图 的 邻接 表 


邻接 表 的 性 质 如 下 : 

(1) 图 的 邻接 表 表示 不 是 惟一 的 ， 它 与 表 结 点 的 链 入 次 序 有 关 ， 

(2) 无 向 图 的 邻接 表 中 第 i 个 边 表 的 结 点 个 数 即 为 第 i 个 顶点 的 度 ; 

(3) 有 向 图 的 邻接 表 中 第 i 个 出 边 表 的 结 点 个 数 即 为 第 i 个 结 点 的 出 度 ， 有 向 图 的 逆 令 
接 表 中 第 i 个 入 边 表 的 结 点 个 数 即 为 第 i 个 结 点 的 入 度 ; 

(4) 无 向 图 的 边 数 等 于 邻接 表 中 边 表 结 点 数 的 一 半 ， 有 向 图 的 弧 数 等 于 邻接 表 ( 逆 邻接 
表 ) 中 出 边 表 结 点 (入 边 表 结 点 ) 的 数目 。 

需要 说 明 的 是 : 

(1) 在 邻接 表 的 每 个 线性 链接 表 中 各 结 点 的 顺序 是 任意 的 ; 

(2) 邻接 表 中 的 各 个 线性 链接 表 不 说 明 它们 顶点 之 间 的 邻接 关系 ; 

(3) 对 于 无 向 图 ， 某 顶点 的 度数 = 该 顶点 对 应 的 线性 链表 的 结 点 数 ， 

(4) 对 于 有 向 图 ， 某 项 点 的 “出 度 ” 数 = 该 顶点 对 应 的 线性 链表 的 结 点 数 ， 求 某 顶 点 的 
“入 度 ” 需 要 对 整个 邻接 表 的 各 链接 扫描 一 遍 ， 看 有 多 少 与 该 顶点 相同 的 结 点 ， 相 则 结 点 
数 之 和 即 为 “入 度 ” 值 。 


*。138 。 数据 结构 与 算法 分 析 (Java 版 ) 


6.2.3 ”关联 矩阵 


图 的 另 一 种 矩阵 表示 法 为 以 项 页 点 和 边 的 关联 关系 为 基础 建立 矩阵 ， 这 个 矩阵 称 之 为 关 
联 窍 阵 。 定 义 如 下 : 


图 G=(V,E) 的 关联 和 矩阵 是 一 个 |x|El 矩 阵 ， 使 得 : 
1 边 e, 和 项 反 V 关 联 1 次 


二 40” 边 e, 和 顶点 v 不 关联 
2 边 e 和 顶点 V 关 联 2 次 


在 一 个 多 图 的 关联 矩阵 中 ， 一 些 列 是 相同 的 ， 一 个 列 只 有 一 个 1 则 代表 一 个 环 。 
图 6-1(b) 中 无 向 图 G2 的 关联 矩阵 为 : 


12 14 23 25 34 35 





本 节 讲 述 的 主要 内 容 为 图 的 深度 优先 搜索 遍历 (DFS) 和 广度 优先 搜索 遍历 (BFS)。 

从 图 中 某 个 顶点 出 发 访问 图 中 所 有 顶点 ， 且 使 得 每 一 顶点 仅 被 访问 一 次 ， 这 一 过 程 称 
之 为 图 的 裔 历 。 图 的 这 历 是 图 的 运算 中 最 重要 的 运算 ， 图 的 许多 运算 均 以 遍历 为 基础 。 

图 的 遍历 按 搜 索 路 径 不 同 分 为 深度 优先 搜索 遍历 (Dep 由 First Search) 和 广度 优先 搜索 
遍历 (Breadth First Search)。 

对 每 种 搜索 顺序 ， 访 问 各 顶点 的 先后 次 序 也 不 是 惟一 的 。 为 了 避免 同一 项 点 被 多 次 访 
问 ， 在 图 的 遍历 过 程 中 必须 记 住 每 个 被 访问 过 的 顶点 ， 一 般 可 设 一 数组 (如 visited) 为 标志 ， 
以 标识 顶点 是 否 被 访问 过 。 若 访问 过 某 项 点 则 相应 的 数组 元 素 为 真 ， 否 则 为 假 。 


6.3.1 冻 度 优先 搜索 饥 历 


假定 给 定 图 G 的 初 态 是 所 有 顶点 均 未 曾 访问 过 ， 在 G 中 任 选 一 顶点 v 为 初始 出 发 点 ， 
则 深度 优先 搜索 可 定义 如 下 ; 从 指定 的 起 点 v 出 发 ( 先 访问 w， 并 将 其 标记 为 已 访问 过 )， 访 
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问 它 的 任意 相 邻 接 的 顶点 wi， 再 访问 wi 的 任 一 个 未 访问 的 相 邻 接 顶 点 wa， 如 此 下 去 ， 直 
到 某 顶 点 已 无 被 访问 过 的 邻接 顶 氮 或 者 它 的 所 有 邻接 顶点 都 已 经 被 访 问 过 了 ， 就 回溯 到 它 
的 前 趋 。 如 果 这 个 访问 和 回溯 过 程 返回 到 遍历 开始 的 顶点 ， 就 结束 遍历 过 程 。 如 果 图 中 仍 
存在 一 些 未 访问 过 的 结 点 ， 就 另 选 一 个 未 访问 过 的 结 点 重新 开始 深度 优先 搜索 遍历 。 

可 见 ， 图 的 深度 优先 搜索 壳 历 是 一 个 递归 过 程 ， 其 特点 是 尽 可 能 先 对 纵深 方向 的 顶点 
进行 访问 。 

对 图 进行 深度 优先 搜索 蜗 历 时 ， 按 访问 顶点 的 先后 次 序 所 得 到 的 顶点 序列 称 为 该 图 的 
深度 优先 搜索 遍历 序列 ， 简 称 为 DFS 序列 。 一 个 图 的 DFS 序列 不 一 定 惟一 ， 这 与 算法 、 
图 的 存储 结构 以 及 初 好 出 发 点 有 关 。 

深度 优先 搜索 遍历 算法 表示 如 下 : 

DFSCV) 
num(v)=i++; 
for 所 有 与 v 邻接 的 顶点 u 
ifnum(u) 是 0 
将 edge(uv) 连 接 到 edges 中 ; 
DFSM); 


depthFirstSearch() 

for 所 有 问 量 v 
num(v)=0; 

edges=null; 

1] 一 1 ， 

while 有 一 个 向 量 v 使 得 num(v) 是 0 
DFS(Y); 

输出 edges; 


图 6-8 包含 了 一 个 实例 ， 利 用 上 述 算法 ， 为 每 个 顶点 赋 了 一 个 数值 hum(v)， 标 在 括号 
内 。 在 完成 所 有 必须 的 初始 化 后 ，depthFirstSearchO 调 用 DFS(a)。 

(1) 第 一 次 用 顶点 a 调用 DFSO，num(a) 赋 值 为 1。a 有 4 个 邻接 顶点 ， 选 择 顶点 e 进 
行 下 一 钦 调用 DFS(e)， 为 这 个 顶点 赋值 2， 也 就 是 num(e)=2， 并 将 edge(ae) 放 入 edges。 

(2) 顶点 e 有 两 个 未 访问 的 相 邻 顶点 ， 先 用 第 一 个 顶点 /调用 DFSO。DFSG) 调 用 产生 
了 赋值 语句 num(f)=3 并 将 edge(efj 放 入 edges。 

(3) 顶 扣 f 只 有 一 个 未 访问 的 相 邻 顶点 i 因此 , 第 4 个 调用 DFSG) 产 生 赋值 语 名 
num(i)=4 并 将 edge(fi) 加 进 edges。 顶 点 i 的 相 邻 顶点 都 已 经 访 问 过 了 ， 因此 ， 返回 调用 DFS(f) 
后 又 返回 到 DFS(e)， 这 里 只 要 知道 num 人 ) 不 为 0 就 知道 项 点 i i 已 经 访问 过 了 ， 这 也 是 不 将 
边 (ei) 洪 加 进 edges 中 的 原因 。 

余下 的 执行 步骤 可 以 参阅 图 6-8(b)。 实 线 标志 着 集合 edges 中 的 边 。 
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(a) 一 个 无 向 图 





(b) 深度 优先 搜索 遍历 示例 
6-8 无 向 图 中 应 用 depthFirstSearch() 算 法 的 示例 
这 个 算法 保证 生成 一 个 树 (或 是 一 个 森林 ， 和 森林 是 树 的 集合 )， 它 包含 或 覆盖 了 原 图 的 


所 有 项 点 。 
图 6-9 说 明了 上 述 算法 在 有 回 图 中 的 执行 。 








(b) 深度 优先 搜索 遍历 示例 


图 6-9 有 向 图 中 应 用 depthFirstSearchO 算 法 的 示例 


depthFirstSearch0) 的 复 末 性 是 O(|V|+|E|) ， 因 为 : 
(1) 为 每 个 顶点 > 初始 化 num(v) 需 要 |y 步 。 : 
(2) 为 每 个 顶点 v 调用 DFS(w) 共 n 次 ， 其 中 是 v 的 边 数 ， 每 条 边 调用 一 次 ， 则 产生 
更 多 的 调用 或 者 结束 递归 调用 链 。 因 此 ， 总 的 调用 次 数 是 2|E 
(3) 语句 中 需要 查找 顶点 。 
while 有 一 个 回 量 v 使 得 num(v) 是 0。 





Lo 
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假定 它 需 要 川 步 。 对 于 一 个 没有 孤立 顶点 的 图 ， 循 环 只 需要 重复 一 次 ， 每 步 都 能 找到 
一 个 初始 状态 的 顶点 ， 尽 管 查找 可 能 需要 似 步 。 对 于 一 个 所 有 的 顶点 都 孤立 的 图 ， 循 环 重 
复 首 次， 每 次 中 每 步 也 能 选择 一 个 顶点 ， 虽 然 这 种 实现 不 能 令 人 满意 ， 但 第 i 次 重复 可 能 
需要 i 步 ， 所 以 循环 总 共 需 要 O(VP) 步 。 : : 


6.3.2 广度 优先 搜索 蜗 历 


设 图 G 的 初 态 是 所 有 顶点 均 未 访问 过 , 在 G 中 任 选 一 顶点 为 初始 出 发 点 ， 则 广度 优 
先 搜索 遍历 的 基本 思想 是 : 从 指定 的 起 点 v 出 发 , 访问 与 它 相 邻 的 所 有 顶点 wj ，w?，……; 
然后 再 依次 访问 w1，w2，…… 邻 接 的 尚未 被 访问 的 所 有 顶点 ， 再 从 这 些 顶 点 出 发 访问 与 它 
们 相 邻接 的 尚未 被 访问 的 顶点 ， 直 到 所 有 顶点 均 被 访问 过 为 止 。 如 果 图 中 仍 存在 一 些 未 访 
问 过 的 结 点 ， 就 另 选 一 个 未 访问 过 的 结 点 重新 开始 广度 优先 搜索 遍历 。 
可 见 ， 图 的 广度 优先 搜索 遍历 是 一 个 递归 过 程 ， 其 特点 是 尽 可 能 先 对 横向 的 顶点 进行 
访问 。 ， 
对 图 进行 广度 优先 搜索 遍历 时 ， 按 访问 顶点 的 先后 次 序 所 得 到 的 顶点 序列 ， 称 为 该 图 
的 广度 优先 搜索 遍历 序列 ， 简 称 为 BFS 序列 。 一 个 图 的 BFS 序列 不 一 定 惟一 ， 这 与 算法 、 
图 的 存储 结构 以 及 初始 出 发 点 有 关 。 
广度 优先 搜索 遍历 算法 (以 队列 作为 基本 数据 结构 ) 表 示 如 下 : 


breadthFirstSearchO 
for 所 有 顶点 
num(u)=0; 
edges=null; 
1 一 | ; 
while 存在 一 个 顶点 v 使 得 num(v)==0 
num(vV)=it+, | 
enqueue(v); /进入 队列 
while 队列 非 空 
v=—dequeue(); 
for 所 有 和 v 邻接 的 顶点 u 
了 num(u) 是 0 
num(u)=1++; 
enqueue(u); | 
将 edge(vu) 连 接 到 edges 中 ; 人， 
输出 edges; : 


图 6-10 和 图 6-11 分 别 显示 了 处 理 一 个 简单 图 和 一 个 有 向 图 的 例子 。 
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(b) 广度 优先 搜索 遍历 示例 
6-10 无 向 图 中 应 用 breadthFirstSearch() 算 法 的 示例 
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(b) 广度 优先 搜索 遍历 示例 
图 6-11 有 同 图 中 应 用 breadthFirstSearchO 算 法 的 示例 


breadthFirstSearchO 在 处 理 其 他 顶点 之 前 先 标记 顶点 v 的 所 有 相 邻 顶点 ， 而 DFSO 只 选 
择 v 的 一 个 相 邻 顶点 ， 先 不 去 处 理 v 的 其 他 相 邻 顶点 而 是 去 找 所 选 的 这 个 相 邻 顶点 的 相 邻 


6.4 ”最 小 生成 树 





本 市 讲述 的 主要 内 容 为 最 小 生成 树 以 及 普 里 姆 (Prim) 算 法 、 克 和 鲁 斯 卡尔 (Kruskal) 算 法 。 
图 论 中 ， 通 常 将 树 定义 为 一 个 无 回路 连通 图 。 对 于 无 回路 连通 图 ， 只 要 选 定 某 个 顶点 
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作为 根 ， 以 此 顶点 为 树 根 对 每 条 边 定向 ， 就 能 得 到 通常 的 树 。 
6.4.1 生成 树 


一 个 连通 图 G 的 子 图 如 果 是 一 棵 包含 G 的 所 有 顶点 的 树 ， 则 该 子 图 称 为 G 的 生成 树 。 

n 个 顶点 的 连通 图 G 的 任何 生成 树 一 定 是 包含 n 个 顶点 和 nn-1 条 边 的 连通 子 图 ( 称 为 
G 的 极 小 连通 子 图 )， 反 之 亦 然 。 

因为 树 被 视 作 一 个 无 回路 的 连通 图 。 一 个 包含 个 顶点 的 连通 图 至 少 含 n - 1 条 边 ( 否 
则 不 连通 )， 男 一 方面 要 使 得 图 中 无 回路 则 至 多 包含 n - 1 条 边 。 

从 以 上 描述 中 可 以 看 出 生成 树 具 有 以 下 特点 : 

(1) 如 果 在 生成 树 中 去 掉 任 何 一 条 边 ， 此 子 图 就 会 变 成 非 连通 图 ， 

(2) 任意 两 个 顶点 之 间 有 且 仅 有 一 条 路 径 ， 如 再 增加 一 条 边 就 会 出 现 一 条 回路 ; 

(3) 由 所 历 连 通 图 G 时 所 经 过 的 边 和 顶点 构成 的 子 图 是 G 的 生成 树 。 

图 G 是 一 个 具有 nn 个 顶点 的 连通 图 , 则 从 G 的 任 一 顶点 出 发 , 作 一 次 深度 优先 搜索 或 
名 上 上 度 优 先 搜 索 , 就 可 将 G 中 的 所 有 n 个 顶点 都 访问 到 。 显而易见 , 在 这 两 种 搜索 算法 中 ， 
从 一 个 已 经 访问 过 的 顶点 搜索 到 一 个 未 曾 访问 过 的 邻接 点 ， 必 定 要 经 过 G 中 的 一 条 边 ， 而 
这 两 种 算法 对 图 中 的 个 顶点 都 仅 访问 过 一 次 , 因此 除 初始 出 发 点 外 , 对 其 余 n -1 个 顶点 
的 访问 一 共 要 经 过 G 中 的 n- 1 条 边 ， 这 n -1 条 边 将 G 中 的 n 个 顶点 连接 成 G 的 极 小 连 
通 子 图 ， 从 而 得 到 G 的 一 棵 生成 树 。 

由 深度 优先 搜索 得 到 的 生成 树 称 为 深度 优先 生成 树 , 简称 为 DFS 生成 树 ; 由 广度 优先 
搜索 得 到 的 生成 树 称 为 广度 优先 生成 树 ， 简 称 为 BFS 生成 树 。 生 成 树 示例 如 图 6-12 所 示 。 


全、 
®@ ) 国 @ 一 一 @ 


(a) 一 个 连通 图 


A 


(b) DFS 生成 树 (c) BFS 生成 树 
图 6-12 ”生成 树 示例 





由 于 从 图 的 遍历 可 求 得 生成 树 ， 如 果 将 生成 树 定义 为 ， 若 从 图 的 某 个 顶点 出 发 ， 可 以 
系统 地 遍历 图 中 的 所 有 项 点 ， 则 遍历 时 经 过 的 边 和 图 的 所 有 顶点 所 构成 的 子 图 ， 称 为 图 的 
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生成 树 。 这 样 ， 如 果 G 是 强 连 通 的 有 向 图 ， 则 从 其 中 任何 一 顶点 v 出 发 , 均 可 遍历 G 中 所 
有 顶点 ， 从 而 得 到 一 棵 以 v 为 根 的 生成 树 。 如 果 G 是 有 根 的 有 问 图 ， 设 根 为 项 点 1， 则 从 
根 1 出 发 也 可 完成 对 G 的 遍历 ， 从 而 得 到 G 的 以 顶点 1 为 根 的 生成 树 。“ 如 图 6-13 所 示 是 
以 顶点 1 为 根 的 有 癌 图 及 其 DFS 生成 树 和 BFS 生成 树 。 


| @ @ |/ | 
N \ | 


® /| 者 
1 | @ 
(b) DFS 生成 树 (c) BFS 生成 树 
图 6-13 有 问 图 及 其 生成 树 


6.4.2 最 小 生成 树 的 生成 


1. 最 小 生成 树 


对 于 连通 网 络 G=(V.E)， 边 是 带 权 的 ， 因 而 G 的 生成 树 的 各 边 也 是 带 权 的 。 生 成 树 的 


各 边 的 权 值 总 和 称 为 生成 树 的 权 ， 并 把 权 最 小 的 生成 树 称 为 G 的 最 小 生成 树 。 图 6-14 所 
示 为 一 个 连通 网 络 。 








图 6-14 连通 网 络 


构成 最 小 生成 树 的 方法 有 多 种 。 这 些 算法 可 以 分 成 下 面 几 类 : 
(1) 创建 并 扩展 一 些 树 ， 使 它们 合并 成 更 大 的 树 ; 
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(2) 扩展 一 个 树 的 集 构成 一 棵 生成 树 ， 如 Kruskal 算法 ; 

(3) 创建 并 扩展 一 棵 树 ， 为 它 添加 新 的 树枝 ， 如 Prim 算法 ， 

(4) 创建 并 扩展 一 棵 树 ， 为 它 添加 新 的 树枝 ， 也 可 能 从 中 删除 一 些 树 枝 。 
无 论 哪 一 类 型 的 算法 均 用 到 了 最 小 生成 树 如 下 所 述 的 性 质 。 

2. MST 性 质 


让 G=( 信 EE) 是 一 个 连通 网 络 ，U 是 顶点 集 依 的 一 个 真子 集 。 如 果 (wu,v) 是 G 中 所 有 的 一 
个 端点 在 U( 即 ev ) 里 , 另 一 个 端点 不 在 U( 刀 vey 一 Uv ) 里 的 边 中 , 具有 最 小 权 值 的 一 条 边 ， 
则 一 定 存 在 G 的 一 棵 最 小 生成 树 包括 此 边 (wu,v)。 这 个 性 质 称 之 为 MST 性 质 。 

MST 性 质 用 反 证 法 证 明 如 下 : 

假设 G 的 任何 一 棵 最 小 生成 树 中 都 不 包含 边 (uv)。 设 T 是 G 的 一 棵 最 小 生成 树 ,，T 不 
包含 边 (u,v)。 由 于 7 了 是 树 ， 是 连通 的 ， 因 此 有 一 条 从 wu 到 v 的 路 径 ， 而 且 该 路 径 上 必 有 一 
条 连接 两 个 顶点 集 U 和 WV- U 的 边 (u"v)， 其 中 weU， vy'ey_U， 人 否则 x 和 vw 不 连通 。 当 
把 边 (w,v) 加 入 树 TT 时， 得 到 一 个 包含 有 边 (wv) 的 回路 ， 如 图 6-15 所 示 ，。 删除 边 (u',v"”)， 上 述 
回路 即 被 删除 , 由 此 得 到 另 一 棵 生成 树 7",7" 和 了 7 区 别 仅 在 于 用 边 (x 取代 了 7 中 的 边 (u'v')。 
因为 (wv) 的 权 小 于 或 者 等 于 (uv) 的 权 ， 所 以 7 的 权 小 于 或 者 等 于 7 的 权 ， 因 此 7 也 是 G 
的 最 小 生成 树 ， 它 包含 边 (wu,v)， 与 假设 矛盾 。 


U 





图 6-15 包含 (u,v) 的 回路 
3. 普 里 姆 (Prim) 算 法 


G(TV,E) 为 一 个 连通 网 ， 顶 点 集 大 (Vi,v2……,vb,)。 设 T(U,TE) 是 所 要 求 的 G 的 一 棵 最 
小 生成 树 ， 其 中 UU 是 7 的 顶点 集 ，TE 是 工 的 边 集 ， 并 且 将 G 中 边 上 的 权 看 作 是 长 度 。 

普 里 姆 算法 的 基本 思想 : 首先 任 选 中 一 顶点 (不 妨 为 vj)， 构 成 入 选 顶 点 集 U={y1}, 
此 时 入 选 边 集 TE 为 空 集 , V 中 剩余 顶点 构成 待 选项 点 集 FU, 在 所 有 关联 于 入 选 顶 点 集 和 
竺 选项 点 集 的 边 中 选取 权 值 最 小 的 一 条 边 ( 记 ww) 加 入 入 选 边 集 (这 里 vw 为 入 选 顶 点 ， vj 为 待 选 
项 束 ) 同时 将 加 入 入 选 顶 点 集 。 重复 以 上 过 程 ; 直至 入 选 顶点 集 U 包含 所 有 顶点 (由)， 
入 选 边 集 包 含 n - 1 条 边 ，MST 性 质保 证 上 述 过 程 求 得 的 T(U,TB) 是 G 的 一 棵 最 小 生成 树 。 

亚 然 普 里 姆 算法 的 关键 是 如 何 找到 连接 U 入 -UU 的 最 短 边 来 扩充 生成 树 7。 个 简 
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单 的 方法 就 是 在 实施 算法 之 前 ， 将 所 有 的 边 进行 排序 。 准 备 加 入 生成 树 的 边 不 仅 不 会 在 树 
中 产生 环 路 , 而 且 也 和 树 中 已 有 的 一 个 顶点 关联 。 如 图 6-16 表示 用 普 里 姆 算法 找到 的 一 栋 
最 小 生成 树 的 过 程 。 











8、 ® py 


(d) 





图 6-16 图 6-14 中 连通 网 络 利 用 Prim 算法 找到 的 一 棵 生成 树 
普 里 姆 算法 伪 代 码 摘 述 如 下 : 
PrimAlgorithm( 带 权 连 通 无 向 图 graph)// 开 始 时 所 有 的 边 都 是 排序 的 


tree=null; 
edges= 按 照 权 值 大 小 排序 的 graph 的 全 部 边 ; 
for i=1 到 Vl-1 
for j=1 到 ledges 
if edge 中 的 边 e 和 tree 中 的 边 不 会 产生 回路 并 且 和 tree 中 的 一 个 顶 扣 关联 
将 ej 添加 进 tree; 
break; 


4. 克 鲁 斯 卡尔 (Kruskal) 算 法 


设 G=(V,E) 是 连通 网 络 ， 令 最 小 生成 树 的 初始 状态 为 只 有 n 个 顶点 而 无 边 的 非 连 通 图 
7T=( 了 太 @),7 中 的 每 个 顶点 自 成 一 个 连通 分 量 。 按 照 长 度 递 增 的 顺序 依次 选择 五 中 的 边 (wv)， 
如 果 该 边 端点 u、v 分 别 是 当前 了 的 两 个 连通 分 量 九 、 丈 中 的 顶 点 ， 则 将 该 边 加 入 到 了 中 ， 
7 、 有 丈 也 由 此 边 连接 成 一 个 连通 分 量 ; 如 果 wu、v 是 当前 同一 个 连通 分 量 中 的 项 点 ， 则 舍 去 
此 边 ， 这 是 因为 每 个 连通 分 量 都 是 一 棵 树 ， 此 边 添加 到 树 中 将 形成 回路 。 依 此 类 推 ， 直 到 
T 中 所 有 项 点 都 在 同一 连通 分 量 上 为 止 。 从 而 得 到 G 的 一 棵 最 小 生成 树 7。 

同样 ， 在 这 个 算法 中 ， 所 有 的 边 都 是 根据 权 排 序 的 ， 然 后 检测 这 个 排序 序列 中 的 每 条 
边 ， 如 果 在 构造 时 ， 加 入 它 不 会 产生 环 路 就 将 它 添 加 到 树 中 。 

死 鲁 斯 卡尔 算法 伪 代 码 朱 述 如 下 : 
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KruskalAlgorithm( 带 权 连 通 无 向 图 graph)// 开 始 时 所 有 的 边 都 是 排序 的 
tree=null; 
edges= 按 照 权 值 大 小 排序 的 graph 的 全 部 边 ; 
for (=Lig|E and ltreel<|V|+ 1;it+) 
if edges 中 的 边 e; 和 tree 中 的 边 不 会 产生 环 路 
将 ei 添加 进 tree; 


如 图 6-17 表示 用 克 鲁 斯 卡尔 算法 找到 的 一 棵 最 小 生成 树 的 过 程 。 
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(d) (e) (f) 
图 6-17 6-14 中 连通 网 络 利 用 Kruskal 算法 找到 的 一 棵 生成 树 


克 鲁 斯 卡尔 算法 和 普 里 姆 算法 产生 的 生成 树 是 相同 的 ， 不 同 之 处 在 于 边 加 入 树 顺 序 
个 同 ， 而 且 普 里 姆 算法 总 是 保持 构造 中 的 树 是 一 片 的 ， 因 此 在 普 里 姆 算法 应 用 的 整个 阶 
段 中 它 都 是 一 棵 树 。 克 鲁 斯 卡尔 算法 在 执行 过 程 中 不 能 保持 是 一 棵 树 ， 可 能 至 多 是 树 的 
集合 ， 但 是 每 条 边 在 克 鲁 斯 卡尔 算法 中 只 需要 考虑 一 次 ， 因 为 如 果 它 在 一 步 当 中 产生 环 
路 ， 则 在 以 后 的 步骤 中 更 会 产生 环 路 ， 因 此 就 不 用 重复 考虑 了 。 从 这 里 可 以 看 出 克 鲁 斯 
卡尔 算法 更 快 。 


6.5 “最短 路径 和 拓扑 排序 


本 节 讲 述 的 主要 内 容 为 最 短路 径 和 拓扑 排序 。 
最 小 生成 树 是 无 同 网 的 一 个 典型 应 用 。 本 节 重 点 介绍 最 短路 径 和 拓扑 排序 ， 它 们 是 有 
同 网 和 有 疝 图 的 应 用 。 
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6.5.1 最短 路径 


带 权 图 中 求 最 短路 径 问 题 ， 即 求 两 个 顶点 间 长 度 最 短 的 路 径 ， 对 现实 生活 中 ， 如 交通 
网 络 问 题 的 解决 具有 重要 的 意义 。 这 里 的 路 径 长 度 不 是 指 路 径 上 边 数 的 总 和 ， 而 是 指 路 径 
上 各 边 的 权 值 总 和 ， 这 里 的 权 值 可 以 代表 距离 、 运 费 等 具有 实际 含义 的 有 效 数 值 。 

设 4 城 到 8B 城 有 一 条 公路 , 两 座 城市 的 海拔 不 同 , 4 城 高 于 B 城 。 这 样 如 果 考 虑 到 上 、 
下 坡 的 车 速 问题 , 则 边 (4,B8) 和 边 (B,4) 上 表示 行驶 时 间 的 权 值 也 不 同 , 因此 边 (4,B) 和 边 (B,4) 
应 该 是 两 条 不 同 的 边 。 这 里 约定 : 路 径 的 开始 顶点 称 为 源 点 ， 路 径 的 最 后 一 个 顶点 称 为 终 
点 。 设 顶点 集 为 碟 {1,2…,n}， 并 假定 所 有 边 上 的 权 值 均 为 表示 长 度 的 非 负 实 数 。 

这 里 主要 讨论 单 源 最 短路 径 问 题 。 

单 源 路 径 最 短 问 题 是 指 : 对 于 给 定 的 有 同 网 络 G=(V,B) 及 单个 源 点 v， 求 从 vv 到 G 的 
其 余 各 顶点 的 最 短路 径 。 

假设 如 图 6-18 所 示 的 有 癌 网 表示 5 个 城市 之 间 的 航线 图 ， 顶点 代表 城市 ， 弧 上 的 权 值 
代表 运输 费用 ， 现 在 要 求 从 某 一 城市 到 其 他 各 城市 的 最 小 运输 费用 。 这 实际 上 就 是 求 有 问 
网 的 最 短路 径 问 题 ， 即 单 源 最 短路 径 问 题 。 








图 6-18 . 有 疝 网 络 


在 图 6-18 中 ， 设 顶点 1 为 源 点 ，1 到 2 的 路 径 只 有 一 条 : 1 一 2(10)， 括 号 中 给 出 的 是 
该 路 径 上 的 权 值 之 和 ， 称 作 路 径 长 度 ; 

1 到 3 的 路 径 有 两 条 : 1 一 2 一 3(60)，1 4 一 3(50); 

1 到 4 的 路 径 有 一 条 : 1 一 4(30); 

1 到 5 的 路 径 有 四 条 : 1 一 5(100),，1 一 4 一 5(90),，1 一 2 一 3 一 5(70)，1 一 4 一 3 一 5(60)。 

选 出 1 到 其 余 各 项 点 的 最 短路 径 ， 并 按 路 径 长 度 递增 顺序 排列 如 下 : 1 一 2(10)，1 一 
4(30)，1 一 4 一 3(50)， 1 一 4 一 3 一 5(60)。 

由 此 可 以 发 现 一 个 规律 : 按 路 径 长 度 递增 顺序 生成 从 源 点 到 其 余 各 顶点 的 最 短路 径 
时 ， 当 前 正 生成 的 最 短路 径 上 除 终点 以 外 ， 其 余 顶 点 的 最 短路 径 均 已 生成 。 

迪 卡 斯 特 拉 (Dijkstra) 算 法 正 是 在 上 述 规律 基础 上 得 到 的 。 其 基本 思想 是 : 设置 两 个 顶 
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扩 集 5S 和 7T，S 中 存放 已 确定 最 短路 径 的 项 点，7T 中 存放 待 确定 最 短路 径 的 顶点 。 初 始 时 ， 
S 中 仅 有 一 个 源 点 ，7 中 包含 除 源 点 外 其 余 顶 点 ， 此 时 各 顶点 的 当前 最 短路 径 长 度 为 源 点 
到 该 顶点 的 弧 上 的 权 值 。 接 着 选取 7 中 当前 最 短路 径 长 度 最 小 的 一 个 顶点 vy 加 入 S$， 然 后 
修改 了 中 剩余 项 点 的 当前 最 短路 径 长 度 。 修 改 的 原则 是 ， 当 v 的 最 短路 径 长 度 与 到 了 中 
的 项 反之 间 的 权 值 之 和 小 于 该 顶点 的 当前 最 短路 径 长 度 时 ， 用 前 者 替换 后 者 。 重 复 上 述 过 
程 ， 直 全 S 中 包含 所 有 的 顶点 。 
迪 卡 斯 特 拉 算 法 伪 代 码 描述 如 下 : 
S={V}; 
置 工 中 各 项 点 的 距离 值 ; 
while S 中 顶点 数 <n 
{ 
在 TT 中 选择 距离 值 最 小 的 顶点 u; 
S=S+{u}; 
调整 T 中 剩余 顶点 的 距离 值 ; 
} 


如 图 -6-19 给 出 了 图 6-18 中 有 向 网 络 从 顶点 1 到 其 他 各 顶点 最 短路 径 的 过 程 ， 其 中 用 
实 线圈 表示 已 确定 最 短路 径 的 顶点 ， 实 线 箭头 表示 已 确定 距离 的 最 短路 径 上 的 弧 ， 顶点 旁 





(0 
有 四 
oo 10 


而 ”AN 10” ~、 
uo 30 2 J 30 (0 
~ (100) ~、 ~ (100) 
50 可 
eo 






co fAN 
| " Y 六 人 





(60) G0《4) 
@) 


(a) 








(60 (9-20 





(d) (e) 
6-19 采用 迪 卡 斯 特 拉 算法 求 图 6-1 中 有 向 图 最 短路 径 的 过 程 


下 面 举例 说 明 迪 卡 斯 特 拉 算 法 。 
如 图 6-20 所 示 ， 求 从 顶点 0 到 其 余 各 顶点 的 最 短路 径 ， 如 表 6-1 所 示 。 
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图 6-20 有 向 网 络 


表 6-1 图 6-20 中 从 顶点 0 到 其 余 各 点 的 最 短路 径 


路 径 长 度 


(1) 将 有 向 网 络 用 邻接 矩阵 表示 , 即 用 权 值 代替 邻接 矩阵 中 原来 的 1， 者 无 权 值 的 边 可 
用 < 来 表示 。 


B 0 0 1 
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(2) 算法 中 需 一 个 顶点 集合 8, 初始 时 其 中 只 有 一 个 源 上 后 ,以 后 陆续 将 已 求 得 的 最 短路 
径 的 顶点 加 入 到 该 集合 中 ， 当 全 部 项 点 进入 集合 后 算法 结束 。 可 用 一 维 数组 代 和 合集 合 ， 集 
合 外 顶点 vi 对 应 数组 S[] 值 为 0， 集 合 内 顶点 六 对 应 数组 $S[] 什 为 1。 

(3) 再 设 一 个 数组 dist 用 于 存放 最 短路 径 ， 每 当 一 个 顶点 进入 集合 S 时 就 要 修改 此 数 
组 中 的 最 短路 径 ( 这 些 都 是 中 间 结 果 )， 当 最 后 一 个 项 点 进入 集合 S， 表 修改 完 dist 中 的 值 ， 
即 得 到 茶点 到 各 点 的 最 短路 径 。 

迪 卡 斯 特 拉 算 法 过 程 如 下 : 

(1) 
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(2) 
0 1 2 3 4 5 
S 1 0 1 0 0 0 
dist 0 00 10 60 30 100 
(G3) 
0 1 2 3 4 5 
S ] 0 1 0 1 0 
dist 0 oo 10 30 30 90 
(4) 
0 1 2 3 4 5 
S 1 0 | [ 1 0 
dist 0 oo 10 30 30 60 
(5) 
0 | 2 3 4 5 
S ] 0 0 0 0 0 
dist 0 oo 10 30 30 60 


6.5.2 拓扑 排序 


在 现实 世界 中 ， 需 要 执行 一 系列 任务 。 一 些 任务 关系 到 先 执行 哪 一 个 ， 而 另 一 些 任务 
的 执行 顺序 就 无 关 紧 要 。 如 房地产 项 目 ， 可 以 用 一 个 有 问 图 来 描绘 其 实施 过 程 。 显 然 这 个 
房地产 项 目 可 以 由 若干 个 子 工程 或 子 系统 构成 , 如 果 把 子 工程 或 子 系统 称 为 活动 (Activity)， 
这 些 活动 之 间 就 存在 先后 次 序 关 系 ， 即 某 项 活动 的 实施 必须 以 另 一 项 活动 的 完成 为 前 提 。 
我 们 可 以 用 一 个 有 向 图 的 顶点 代 表 一 项 活动 ,用 有 向 图 的 弧 代 表 活 动 之 间 的 先后 次 序 关 系 ， 
即 弧 代 表 先 决 条 件 ， 当 一 项 活动 i 是 男 一 项 活动 j 的 先决 条 件 时 ， 有 向 图 中 存在 边 <i,>。 

用 顶点 表示 活动 ， 用 绝 表 示 活 动 之 间 的 先后 次 序 关 系 的 有 向 图 ， 称 为 顶点 活动 图 
(Activity On Vertex Network), 简称 为 AOV 网 。 可 见 AOV 网 的 特点 是 在 网 中 一 定 不 能 有 有 
同 回 路 。 检 测 网 中 是 否 存 在 环 ， 则 采用 拓扑 排序 的 方法 。 


1. 什么 是 拓扑 排序 


对 于 一 个 AOV 网 ， 通 常 需 要 把 它 的 所 有 顶点 排 成 一 个 满足 下 述 关 系 的 线性 序列 vi， 
vm，…，V， 如 果 AOV 网 中 从 顶点 到 顶点 vv 有 一 条 路 径 ， 则 在 该 线性 序列 中 顶点 vj 必 在 
顶点 之前。 满足 这 种 线性 关系 的 序列 称 为 拓扑 序列 。 

对 AOV 网 构造 拓扑 序列 的 操作 称 为 拓扑 排序 。 即 将 AOV 网 中 各 个 顶点 排列 成 一 个 有 
序 序列 ， 使 得 所 有 前 趋 和 后 继 关 系 都 能 得 到 满足 ， 而 那些 没有 次 序 关 系 的 顶点 ， 在 拓扑 排 
序 的 序列 中 可 以 播 到 任意 位 置 。 拓 扑 排序 是 对 非 线形 结构 的 有 向 图 进行 线形 化 的 重要 手段 。 

并 非 任何 AOV 网 的 顶点 都 可 以 排 成 拓扑 序列 。 如 果 网 中 存在 有 向 回路 ， 则 找 不 到 该 
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网 的 拓扑 序列 。 一 般 情况 下 ，AOV 网 不 应 该 存在 有 向 回路 ， 因 为 如 果 存 在 回路 就 意味 着 某 
项 活动 的 开工 是 以 自己 工作 的 完成 为 先决 条 件 的 ， 这 种 死 锁 的 现象 会 导致 项 目 不 可 行 。 而 
任何 无 回路 的 AOV 网 ， 其 顶点 都 可 以 排 成 一 个 拓扑 序列 ， 并 且 拓 扑 序列 不 一 定 是 惟一 的 。 


2. 拓扑 排序 的 算法 


拓扑 排序 的 算法 的 基本 步骤 是 : 
(1) 从 网 中 选择 一 个 入 度 为 0 的 顶点 并 和 输出; 
(2) 从 网 中 删除 此 顶点 及 其 所 有 出 边 。 
其 算法 摘 述 为 : 
topologicalsort(digraph) 
for i=l 到 |V| 
寻找 一 个 最 小 顶 扩 V; 


num(v)=]; 


从 digraph 中 删除 项 点 v 以 及 与 v 相关 联 的 所 有 边 ; 


如 图 6-21 即 是 这 个 算法 的 一 个 应 用 示例 。 图 6-21(a) 经 过 一 系列 删除 产生 序列 : g，e， 
Bb» fs dy Cy Us 
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(h) 
图 6-21 拓扑 排序 的 执行 


对 图 6-22(a) 中 的 有 问 图 进行 拓扑 排序 ， 写 出 有 向 图 的 一 个 拓扑 序列 。 方 法 如 下 ; 
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图 6-22 拓扑 排序 示例 


(1) 在 图 6-22(a) 中 的 有 向 图 中 选取 入 度 为 0 的 顶点 3， 删 除 3 及 其 相关 联 的 两 条 弧 ， 
如 图 6-22(b) 所 示 ; 

(2) 再 在 图 6-22(b) 中 选取 入 度 为 0 的 顶点 1, 删除 1 及 其 相关 联 的 两 条 弧 , 如 图 6-22(c) 
所 示 ; 

(3) 再 在 图 6-22(c) 中 选取 入 度 为 0 的 顶点 4, 删除 4 及 其 相关 联 的 一 条 弧 , 如 图 6-22(d) 
所 示 ; 

(4) 再 在 图 6-22(d) 中 选取 入 度 为 0 的 顶点 5, 删除 5 及 其 相关 联 的 两 条 弧 , 如 图 6-22(e) 
所 示 ; 

(5) 再 在 图 6-22(e) 中 选取 入 度 为 0 的 顶点 2, 删除 2 及 其 相关 联 的 一 条 弧 , 如 图 6-22(f) 
所 示 ; 

(6) 最 后 选取 项 点 6， 得 到 有 向 图 的 一 个 拓扑 序列 : 3，1，4，5，2，6。 


思考 和 练习 


(1) 一 个 图 与 一 个 简单 图 之 间 有 什么 区 别 ? 

(2) 在 一 个 无 癌 图 中 ， 一 条 边 自 己 可 以 是 一 条 路 径 吗 ? 

(3) 为 什么 一 个 简单 图 的 定义 禁止 环 ， 而 有 向 图 的 定义 允许 环 ? 
(4) 图 G=( 也 轧 中 ， 边 数 和 所 有 顶点 度数 总 和 的 关系 是 什么 ? 
(5) 男 出 nn 个 后 的 完全 图 ，n=2,，3，4，5，6。 

(6) 判断 真 假 : 
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若 一 个 图 有 nn 个 点 ，n(n - 1)/2 条 边 ， 则 它 一 定 是 一 个 完全 图 。 


e。 一 条 路 径 的 长 度 一 定 小 于 图 的 大 小 。 

e 一 条 回路 的 长 度 等 于 它 包 含 的 不 同 点 的 个 数 。 

e 如 果 一 个 图 的 关联 和 矩阵 有 n 条 边 ，n(n - 1)/2 列 ， 则 该 图 一 定 是 一 个 完全 图 。 
e。 在 一 个 有 向 图 的 关联 矩阵 中 ， 每 一 行 的 项 数 的 总 和 等 于 该 点 的 入 度 。 

we 


一 个 图 的 关联 矩阵 的 所 有 项 的 和 等 于 ?| 可 。 

一 个 有 向 图 的 关联 窍 阵 的 所 有 项 的 和 等 于 0。 

(7) 画 出 半 个 点 的 完全 图 的 邻接 矩阵 和 关联 窍 阵 。 

(8) 一 个 图 ( 态 回 ， 若 | 可 = 6( | 四) ， 称 为 稠密 ;车 | 可 =o( Il) ， 称 为 称 查 。 
e。 对 稠密 图 而 言 ， 这 3 种 表示 (邻接 和 矩阵、 关联 窍 阵 、 邻 接 表 ) 哪 一 种 最 好 ? 
e。 对 稀疏 图 而 言 ， 这 3 种 表示 (邻接 和 矩阵、 关联 窍 阵 、 邻 接 表 ) 哪 一 种 最 好 ? 
(9) 画 出 一 棵 树 ， 它 有 n 个 顶点 ，n - 1 条 边 。 

(10) 画 一 个 简单 图 ， 说 明 如 果 它 有 一 个 生成 树 ， 那 么 它 就 是 连通 的 。 

(11) 某 带 权 无 向 图 如 图 6-23 所 示 。 


， /A> A 和 

0 ) 《9 2 ) 

> ri 和、 AN dh TI 
(A ) MAD < 2 | 

Cy =~、 ; 1 id 4 A 区 -= ms、 

,4 全 一 一 他) 


图 6-23 ” 带 权 无 回 图 


给 出 其 邻接 矩阵 和 邻接 表 表 不 。 

画 出 以 4 为 起 点 的 一 棵 深度 优先 生成 树 和 广度 优先 生成 树 。 

画 出 以 DD 为 起 点 的 一 棵 深度 优先 生成 树 和 广度 优先 生成 树 。 

用 Kruskal 算法 求 其 最 小 生成 树 。 要 求 画 出 依次 选取 每 一 条 边 的 过 程 。 
e 用 Prim 算法 求 其 最 小 生成 树 ， 并 画 出 每 一 步骤 结果 。 

(12) Dijkstra 算法 是 如 何 应 用 到 无 回 图 中 的 ? 

(13) 修改 Dijkstra 算法 ， 使 其 可 以 查找 从 顶点 a 到 顶点 4b 的 最 短路 径 。 
(14) 找 出 图 6-24 顶点 1 到 各 顶点 间 的 最 短路 径 。 


A 








图 6-24 题 14 图 
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(15) 设 有 向 图 G=( 玫 有 瓦 ， 试 设计 一 个 函数 cycle， 检 测 G 中 是 否 存 在 回路 ( 环 )， 若 存在 
回路 ， 则 输出 回路 上 的 全 部 顶点 。 
(16) 如 何 找 到 第 二 小 的 生成 树 ? 
(17) 怎样 用 最 小 生成 树 算法 查找 最 大 生成 树 ? 
(18) 一 个 锦标 赛 是 一 个 有 同 图 ， 它 的 每 对 顶点 间 恰 好 有 一 条 边 ， 
e 一 个 锦标 赛 有 多 少 条 边 ? 
可 以 创建 多 少 个 n 条 边 的 锦标 赛 ? 
能 不 能 给 每 个 锦标 赛 进 行 拓扑 排序 ? 
一 个 锦标 赛 有 多 少 个 最 小 顶点 ? 
传递 锦标 赛 是 一 个 锅 标 赛 , 如 果 存 在 边 edge(vu) 和 edge(uw), 则 必 存 在 边 edge(vw)。 
这 种 锦标 赛 能 不 能 有 环 ? 
(19) 假定 G 是 下 面 邻 接 和 矩阵 表示 的 图 。 


0 10 10 

1 0 101 

010 10 

1 1 101 

0 1101 

e 男 出 C。 

e C 是 简单 图 吗 ? 
e G 是 有 问 图 吗 ? 
“ @。 G 是 强 连通 吗 ? 
e G 是 弱 连 通 吗 ? 


e G 是 无 环 图 吗 ? 

(20) 有 4 种 遍历 二 又 树 的 算法 : 前 序 遍 历 、 中 序 遍 历 、 后 序 遍 历 、 同 层次 遍历 。 若 一 
个 二 叉 树 是 一 个 连通 无 环 图 ， 下 面 搜索 方法 属于 哪个 算法 ? 

e 深度 优先 搜索 

e 宽度 优先 搜索 
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排序 是 计算 机 程序 设计 中 的 一 种 重要 操作 ， 掌 握 排序 的 方法 ， 可 以 在 实际 的 应 用 过 程 
中 提高 查找 的 效率 。 


本 章 的 学 习 目 标 : 

e 排序 的 基本 概念 ; 

e 几 种 内 部 排序 的 基本 思想 、 算 法 和 性 能 ; 

e 外 部 排序 中 的 二 路 归并 、 置 换 选 择 和 多 路 归并 算法 。 


7.1 概 述 


如 果 数 据 能 够 根据 某 种 规则 排序 ， 就 能 大 大 提高 数据 处 理 的 算法 效率 。 例 如 ， 在 一 本 
电话 黄页 中 ， 如 果 名 称 或 号 码 不 按 一 定 的 规律 排序 ， 那 么 要 碍 找 一 个 名 称 或 号 码 几 乎 是 不 
可 能 的 。 同 样 的 道理 ， 对 于 字典 、 学 生 名 册 等 其 他 需要 按 顺 序 组 织 的 东西 也 是 一 样 的 。 由 
此 可 见 ， 使 用 排序 的 方便 性 是 毋庸 质疑 的 ， 而 且 它 对 计算 机 科学 也 是 如 此 。 尽 管 计 算 机 比 
人 处 理 无 序 的 数据 更 容易 、 更 快 ， 但 是 用 和 它 来 处 理 这 样 的 无 序数 据 集 是 极其 低 效 的 。 通 第 
在 处 理 数据 之 前 要 对 其 先进 行 排序 。 


7.1.1 排序 的 基本 概念 


所 谓 排 序 就 是 整理 文件 中 的 记录 ， 使 之 按 关 键 字 递增 (或 递减 ) 的 次 序 排 列 起 来 。 其 确 
切 的 定义 如 下 : 

假设 含 n 个 记录 的 序列 为 {Ri,R2…, Rn}， 其 相应 的 关键 字 序 列 为 {K1,K2…,Kn}， 需 确定 
1,2,…,n 的 一 种 排列 Rn,R2z…,Rmn， 使 其 相应 的 关键 字 满 足 Ki 志 Kp 志 … 志 Kin( 或 贡 之 Kp 之 … 
宇 Kin) 的 关系 。 

简单 地 说 ， 使 序列 {RI1,R2…,R,} 成 为 一 个 按 关 键 字 有 序 的 序列 {Rn,Rp…,Rin}， 这 样 的 一 
种 操作 称 为 排序 。 其 输入 内 容 为 n 个 记录 Ri,R2,…,R,， 其 相应 的 关键 字 分 别 为 Ki,Ko,…,K， 
其 输出 的 内 容 为 Ra,Rip,…,Rin， 使 得 天 1 委 民 和 过 … 委 天 (或 区 宇 Kp 之 … 宇 Ki,)。 


1. 排序 的 对 象 
排序 的 对 象 是 文件 , 它 由 一 组 记录 组 成 。 每 条 记录 则 由 一 个 或 阁 干 个 数据 项 (或 域 ) 组 成 。 
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2. 排 友 运算 的 依据 


所 谓 关 键 字 项 就 是 可 用 来 标识 一 个 记录 的 一 个 或 多 个 组 合 的 数据 项 。 该 数据 项 的 值 称 
为 天 键 子 (Key)。 需 注意 的 是 ， 在 不 易 产 生 混淆 时 ， 可 将 关键 字 项 简称 为 关键 字 。 用 来 作为 
排序 运算 依据 的 关键 字 ， 可 以 是 数字 类 型 ， 也 可 以 是 字符 类 型 。 关 键 字 的 选取 应 根据 问题 
的 要 求 而 定 。 : : 

例如 ， 在 学 生成 绩 统 计 中 将 每 个 学 生 作 为 一 个 记录 。 每 条 记录 包含 学 号 、 姓 名 、 各 科 
的 分 数 和 总 分 数 等 内 容 。 若 要 惟一 地 标识 一 个 考生 的 记录 ， 则 必须 用 “学 号 ”作为 关键 字 。 
坷 要 按照 考生 的 总 分 数 排名 次 ， 则 需 用 “总 分 数 ” 作 为 关键 字 。 


7.1.2 ”排序 的 稳定 性 


当 符 排序 记录 的 关键 字 均 不 相同 时 ， 排 序 结果 是 惟一 的 ， 否 则 排序 结果 不 惟一 。 

在 竺 排序 的 文件 中 ， 若 存在 多 个 关键 字 相 同 的 记录 ， 经 过 排序 后 这 些 具 有 相同 关键 字 
的 记录 之 间 的 相对 次 序 保持 不 变 ， 该 排序 方法 是 稳定 的 ， 若 具有 相同 关键 字 的 记录 之 间 的 
相对 侈 序 发 生变 化 ， 则 称 这 种 排序 方法 是 不 稳定 的 。 排 序 算法 的 稳定 性 是 针对 所 有 输入 实 
例 而 言 的 。 即 在 所 有 可 能 的 输入 实例 中 ， 只 要 有 一 个 实例 使 得 算法 不 满足 稳定 性 要 求 ， 则 
该 排序 算法 就 是 不 稳定 的 。 


7.1.3 ”排序 的 分 类 


按 在 排序 过 程 中 是 否 涉及 数据 的 内 、 外 存 交 换 来 分 类 ， 排 序 大 致 分 为 两 类 ， 内 部 排序 
和 外 部 排序 。 在 排序 过 程 中 ， 若 整个 文件 都 放 在 内 存 中 处 理 ， 排 序 时 不 涉及 数据 的 内 、 外 
存 交 换 ， 则 称 之 为 内 部 排序 (简称 内 排序 )， 反 之 ， 若 排序 过 程 中 要 进行 数据 的 内 、 外 存 交 
换 ， 则 称 之 为 外 部 排序 。 一 般 情况 下 ， 内 排序 适宜 在 记录 个 数 不 多 的 小 文件 中 使 用 ， 外 排 
序 则 适用 于 记录 个 数 太 多 ， 不 能 一 次 将 其 全 部 记录 放 入 内 存 的 大 文件 。 

对 于 外 排序 ， 可 以 进一步 分 为 两 种 方法 ; 

e: 合并 排序 法 

e 直接 合并 排序 法 

对 于 内 排序 ， 按 策略 进行 划分 ， 可 以 分 为 : 
插入 排序 
选择 排序 
交换 排序 
归并 排序 
分 配 排 序 
在 后 面 的 章节 中 将 分 别 介绍 内 排序 的 几 种 排序 方法 和 合并 排序 法 。 
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7.1.4 排序 算法 分 析 


当 比较 两 个 排序 算法 时 ， 最 直截了当 的 方法 是 对 它们 进行 编程 ， 然 后 比较 它们 的 运行 
时 间 。 但 是 ， 有 些 算法 的 运行 时 间 依赖 于 原始 输入 记录 的 情况 ， 特 别 是 记录 的 数量 、 记 录 
的 大 小 、 关 键 字 的 可 操作 区 域 以 及 输入 记录 的 原始 有 序 程 度 等 ， 这 些 都 会 大 大 影响 排序 算 
法 的 相对 运行 时 间 。 因 此 ， 这 种 比较 方法 也 就 失去 了 意义 。 

分 析 排序 算法 时 ， 传 统 方法 是 衡量 关键 字 之 间 进 行 比较 的 次 数 。 这 种 方法 通常 与 算法 
消耗 的 时 间 有 关 ， 而 与 机 器 和 数据 类 型 无 关 。 但 是 在 一 些 情况 下 ， 记 录 也 许 很 大 ， 以 致 于 
它们 的 移动 是 影响 程序 整个 运行 时 间 的 重要 因素 。 因 此 ， 排 序 算法 分 析 应 该 考虑 比较 的 次 
数 和 数据 移动 的 次 数 。 

并 不 总 是 需要 或 是 可 能 确定 比较 的 准确 次 数 ， 因 此 只 能 计算 一 个 近似 值 。 比 较 和 移动 
的 次 数 都 用 大 0 表示 法 ， 通 过 给 定 这 些 数 的 数量 级 来 近似 。 但 是 ， 数 量 级 因数 据 的 初始 顺 
序 不 同 而 不 同 。 例 如 ， 在 数据 已 经 排序 的 情况 下 ， 机 器 需要 多 少时 间 用 于 数据 排序 呢 ? 它 
是 直接 识别 出 这 个 初始 的 排序 还 是 对 此 毫 无 觉察 呢 ? 因此 ， 效 率 的 测定 也 指示 算法 的 聪明 
程度 。 也 正 是 如 此 ， 计 算 以 下 3 种 情况 下 的 比较 和 移动 次 数 : 最 好 情况 (通常 是 数据 已 经 排 
序 )、 最 坏 情况 (通常 是 数据 按 反 序 存放 ) 和 平均 情况 (数据 是 随机 顺序 的 )。 有 些 排序 算法 无 
视 初始 排序 的 数据 ， 总 是 执行 相同 的 操作 。 这 些 算法 的 效率 是 很 容易 测量 的 ， 但 是 它 的 性 
能 通常 不 会 很 好 。 有 很 多 排序 方法 在 这 3 种 情况 下 的 性 能 是 过 然 不 同 的 。 比 较 次 数 和 移动 
次 数 不 必 相同 。 一 个 算法 可 以 在 前 者 上 非常 高 效 而 在 后 者 上 非常 低 效 ， 反 之 亦 然 。 所 以 可 
以 根据 实际 条 件 选择 使 用 哪 一 种 算法 . 


7.2 插入 排序 


插入 排序 的 基本 思想 是 : 每 次 将 一 个 待 排序 的 记录 按 其 关键 字 大 小 插入 到 前 面 已 经 排 
好 序 的 子 文件 的 适当 位 置 ， 直 到 全 部 记录 插入 完成 为 止 。 本 节 介 绍 两 种 插入 排序 方法 :， 直 
接 插入 排序 和 希 尔 排序 。 


7.2.1 直接 插入 排序 


1. 基本 思想 


直接 插入 排序 是 一 种 最 简单 的 排序 方法 ， 它 的 基本 操作 是 将 一 个 记录 插入 到 已 排 好 序 
的 有 序 表 中 ， 从 而 得 到 一 个 新 的 有 序 表 。 它 的 基本 思想 是 ， 假设 待 排序 的 记录 存放 在 数组 
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插入 到 有 序 区 R[1……1 的 适当 位 置 ， 使 R[1……i+t1] 变 为 新 的 有 序 区 ， 每 次 插入 一 个 数据 ， 
直到 所 有 的 数据 有 序 为 止 。 


2. 插入 算法 


前 提 条 件 ， 序 列 s={so,s1,s2,…,sn-1} 是 n 个 可 排序 元 素 的 序列 。 
(1) 令 i 从 1 递增 到 nn - 1， 重复 步骤 (2)~(4)。 

(2) 将 元 素 8% 保存 到 临时 变量 中 。 

(3) 确定 使 得 条 件 s, 宇 s; 成 立 的 最 小 的 j。 

(4) 将 子 序列 {5…,si-1} 后 移 一 个 位 置 到 {jn1,…,si)。 

(5) 将 保存 在 临时 变量 中 的 原来 的 s; 复 制 到 sy。 

(6) 打印 排序 结果 。 


3. Java 程序 
按照 直接 插入 排序 的 算法 ， 其 具体 程序 如 下 : 


/i 


Program Description 
// 程 序 名 称 :insertsort.java 
// 程 序 目 的 :使 用 直接 插入 排序 法 设计 一 个 排序 程序 
/f 
Import java.util.*; 


import java.i0.*; 


public class insertsort 


\ 
public static int[] Data=new int[10];// 数 据 数 组 


public static vold main (String args[]) 
{ 

int i; /循环 变量 

int Index; /数组 下 标 变量 


9%ystem.out.primtin("Please input the values you want to sort(Exit for 0):"); 


Index=0;// 数 组 下 标 变 量 初始 值 
// 读 取 输 入 数据 存 入 数组 中 
InputStreamReader is=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is); 


StringTokenizer st; 
do // 读 取 输 入 值 
t 


System.out.print("Data "+Index+":"); 
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ty{ 
String myline=br.readLine(); 
st=new StringTokenizer(myline); 
Data[lIndex]=Integer.parseInt(st.nextToken());// 取 得 输入 值 
和 
catch(IOException ioe) 
System.out.pIint( "IO error:"+ioe); 
Index+ 十 ; 
}while (Data[Index-1] !=0); 
// 排 序 前 数据 内 容 
System.out.print("Before Insert Sorting:"); 
for (1=0;i<Index-1;i++) 
System.out.print(" "+Datafi]+" "); 
System.out.PTintln(” ); 


InsertSort(Index-1); /插入 排序 
/排序 后 结果 
>ystem.out.print( After Insert Sorting:"); 
for (1=0;,i<Index-1;i++) 
System.out.print(" "+Data[i]+" "); 
System.out.println(™ "); 


} 
//------------------------------------------------------------ 
/直接 搬入 排序 
//------------------------------------------------------------ 


public static vold InsertSort(int Index) 
int ij,K; ”// 循 环 变 量 
int InsertNode; // 欲 插入 数据 变量 
for (=]1;i<Index: i++); V 依 序 插入 数值 
InsertNode=Datafil; // 设 定 欲 插入 的 数值 
J=i-]; 
// 找 适当 的 插入 位 置 
while (J>=0 && InsertNode<Datalj]) 
\ 
Data[j+1]=Datafj]; 
J--， 
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Pata[j+1]=InsertNode; /将 数值 插入 
/打印 当前 排序 结果 
System.out.print("Current sorting result:"); 
for (k=0;k<Index;k++) 
System.out.print(" “十 Data[k]+ "); 
System.out.printIin("™"); 


} 
} 


4. 直接 插入 排序 法 的 算法 分 析 


(1) 算法 的 时 间 性 能 分 析 
对 于 具有 nn 个 记录 的 文件 ， 要 进行 n - 1 趟 排序 。 
各 种 状态 下 的 时 间 复 来 度 如 表 7-1 所 示 。 


表 7-1 各 种 状态 下 的 时 间 复 杂 度 


初始 文件 状态 无 序 (平均 
第 1 超 的 天 键 季 比较 次 数 | (i - 2)/2 
总 关键 字 比 较 次 数 N-1 4 
第 1 趟 记录 移动 次 数 0 | | ca 
总 的 记录 移动 次 数 0 | | si 
_ 时 间 复杂 度 om | om | ou 


(2) 算法 的 空间 复杂 度 分 析 

算法 所 和 需 的 辅助 空间 是 一 个 监视 哨 ， 辅 助 空间 复杂 度 S(n)=O(1)， 是 一 个 就 地 排序 。 
(3) 直接 插入 排序 的 稳定 性 

直接 插入 排序 是 稳定 的 排序 方法 。 


7.2.2 希 尔 排序 


1. 基本 思想 


希 尔 排 序 (Shell Sort) 是 插入 排序 的 一 种 。 因 D.L.Shell 于 1959 年 提出 而 得 名 。 其 基本 
思想 是 ， 先 取 定 一 个 小 于 n 的 整数 di 作为 第 一 个 增 量 ， 把 文件 的 全 部 记录 分 成 di 个 组 ， 
所 有 距离 为 di 的 倍数 的 记录 放 在 同一 个 组 中 ， 在 各 组 内 进行 插入 排序 ， 然 后 ， 取 第 二 个 增 
量 4<d!， 重 复 上 述 的 分 组 和 排序 ， 直 至 所 取 的 增 量 d=1(dj<4,-1<…<qdy<d1)， 即 所 有 记录 放 
在 同一 组 中 进行 直接 插入 排序 为 止 。 
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2. 具体 算法 
按照 希 尔 排序 的 基本 思想 ， 其 具体 算法 如 下 : 


/一 一 一 一 一 一 一 一 一 Program Description 
/程序 名 称 :shellsort.java 

/程序 目的 :使 用 希 尔 排 序 法 设计 一 个 排序 程序 
AH/ 


Imbort Java.uti].*; 
Import java.10.*; 
public class shellsort 
t 
public static int[] Data=new int[201;// 数 据 数组 
public static void main (String args[]) 
人 
int i;// 循 环 变 量 
int Index;// 数 组 下 标 变 量 
System.out.println("Please input the values you want to sort(Exit for 0):"): 
Index=0;// 数 组 下 标 变量 初始 值 
// 读 取 输 入 数据 存 入 数组 中 
InputStreamReader is=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is); 
StringTokenizer st: 


do // 读 取 输 入 值 


System.out.print("Data "+Index+":"); 
tryt 
String myline=br.readLine(); 
st=new StringTokenizer(myline); 
Data[Index]=Integer.parselInt(st.nextToken());// 取 得 输入 值 
} 
catch(IOException ioe) 
System.out.print("IQ error:"+ioe); 
| 
Index+ 十 ; 
}while (Data[Index-1] !=0); 

/排序 前 数据 内 容 
9%ystem.out.print( Before Shell Sorting:"); 
for (1i=0;i<Index-1;i++) / 

System.out.print(" "+Datafi}+" "); 
System.out.printin("™"); 
ShellSort(Index-1);// 希 尔 排序 
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System.out.print( After Shell Sorting:"); 

for (1=0;1<Index-1;1++) 
System.out.print(" “+Datali]+" “); 

System.out.printin(™"); 


} 
f=- 
// 希 尔 排序 
//-----------------------~--------------------~----------~----- 
public static void ShellSort(int Index) 
{ 
int ij,k; // 征 环 变 量 
int Temp; /!/ 暂 存 变 量 
boolean Change; // 数 据 是 否 改 变 
int DataLength: /分 割 集合 的 间隔 长 度 
int Pointer: /进行 处 理 的 位 置 
DataLength=(inb Index/2; /初始 集合 间隔 长 度 
while (DataLength !=0) /数列 仍 可 进行 分 割 
{ : : // 对 各 个 集合 进行 处 理 
: for(j=DataLength;j<Index:j++) 
t 
Change=false; 
Temp=Datalj]; // 暂 存 Data[j] 的 值 ， 待 交换 值 时 用 
Pointer=}j-DataLength:; // 计 算 进行 处 理 的 位 置 
/进行 集合 内 数值 的 比较 与 交换 值 
while (Temp<Data[Pointer] && Pointer>=0 && Pointer<=Index) 
{ z z 


DatafPointert DataLength] =Data[Pointer]; 
/计算 下 一 个 欲 进 行 处 理 的 位 置 
Pointer=Pointer-DataLenegth:; 


Change=true; 
if(Pointer<0 || Pointer>Index) 
break; 
} 
// 与 最 后 的 数值 交换 
DatalPointertDataLength|=Temp:; 
if(Change) 
{ /打印 肯 前 排序 结果 


System.out.print( Current sorting result:"); 
for (k=0;k<Index;k+t++) 
System.out.print(" "+Datalk}+" "); 
System.out.printin(™"): 
} } 
DataLength=DataLength/2; /计算 下 次 分 割 的 间隔 长 度 
1 
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3. 希 尔 排序 的 算法 分 析 


(1) 增 量 序列 的 选择 

Shell 排序 的 执行 时 间 依 赖 于 增 量 序 列 。 

好 的 增 量 序列 的 共同 特征 为 : 

e 虑 后 一 个 增 量 必须 为 1; 

e 应 该 尽量 避免 序列 中 的 值 (尤其 是 相 邻 的 值 ) 互 为 倍数 的 情况 。 

通过 大 量 的 实验 ， 给 出 了 目前 较 好 的 结果 : 当 n 较 大 时 ， 比 较 和 移动 的 次 数 约 在 n 

到 1.6n' 人 之 间 。 z 

(2) Shell 排序 的 时 间 性 能 优 于 直接 插入 排序 

希 尔 排 序 的 时 间 性 能 优 于 直接 插入 排序 的 原因 如 下 : 

e 汉文 件 初 态 基 本 有 学时 且 接 插入 排序 所 知 的 比较 和 移动 次 数 均 较 少 。 

e 当 n 值 较 小 时 , n 和 ww 的 差别 也 较 小 , 即 直 接 插入 排序 的 最 好 时 间 复 杂 度 O(n) 和 最 
坏 时 间 复 杂 度 O(n ) 差 别 不 大 。 

e 在 逢 尔 排序 开始 时 增 量 较 大 ， 分 组 较 多 ,每 组 的 记录 数目 少 ,， 故 各 组 内 直接 插入 较 
快 ， 后 来 增 量 @d 逐渐 缩小 ， 分 组 数 逐 渐 减 少 ， 而 各 组 的 记录 数目 逐渐 增多 ， 但 由 于 
己 经 反 di;- 1 作为 距离 排 过 序 ， 使 文件 较 接 近 于 有 序 状 态 ， 所 以 新 的 一 趟 排序 过 程 也 
较 快 。 因 此 ， 希 尔 排序 在 效率 上 较 直 接 插入 排序 有 较 大 的 改进 。 

(3) 稳定 性 . 

条 尔 排序 是 一 种 不 稳定 的 排序 方法 


73 交换 排序 


交换 排序 的 基本 思想 是 : 两 两 比较 待 排序 记录 的 关键 字 ， 发 现 两 个 记录 的 次 序 相反 时 
即 进行 交换 ， 直 到 没有 反 序 的 记录 为 止 。 应 用 交换 排序 基本 思想 的 主要 排序 方法 有 冒 泡 排 
序 和 快速 排序 。 


7.3.1 冒 泡 排序 


1. 基本 思想 


冒 泡 排序 的 基本 思想 是 : 设想 被 排序 的 记录 关键 字 保 存在 数组 R[1…n] 中 ,将 每 个 记录 
R[ 看 作 是 重量 为 R[i].key 的 气泡 。 根据 轻 气 泡 不 能 在 重 气 泡 之 下 的 原则 ， 从 下 往 上 扫描 数 
组 R; ， 凡 扫描 到 违反 本 原则 的 轻 气 泡 ， 就 使 其 向 上 “飘浮 ”。 如 此 反复 进行 ， 直 到 最 后 任 
何 两 个 气泡 都 是 轻 者 在 上 ， 重 者 在 下 为 止 。 
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2. 具体 算法 


前 提 条 件 ， 序 列 s={s0,31,52,….,5n-1} 是 n 个 可 排序 元 素 的 序列 。 
(1) 令 7 从 n -1 递减 到 1， 重复 步 又 (2)~(4)。 

(2) 令 i 从 1 递增 到 7， 重 复 步 又 (3)。 

(3) 如 果 元 素 w% -1 和 8 成 反 序 ， 交 换 它 们 。 

(4) 结束 标记 ， 序 列 {so…,s} 被 排序 且 sj 最大。 

3. Java 程序 


按照 冒 泡 排序 的 算法 ， 其 具体 程序 如 下 : 


// = 一 一 一 一 一 一 一 一 一 Program Descrition 
// 程序 名 称 : bubblesort.java 
/ 程序 目的 :使 用 冒 泡 排 序 法 设计 一 个 排序 程序 。 
// 
import Java.util.*; 
Import java.io.*; 
public class bubblesort 
{ 
public static int[] Data = new int[10]; 
public static vold main (String argsf]) 
int i; /循环 计数 变量 
int Index; /数组 下 标 变量 
System.out.println("Please input the values you want to sort (Exit for 0):"); 
Index = 0; 
/ 读 取 输入 数据 存 入 数组 中 
InputStreamReader is=new InputStreamReader(System .in); 
BufieredReader br=new BufferedReader(is); 
StrngTokenizer st; 
do // 读 到 输入 值 


System.out.print("Data "+Index+" : "); 
tryt 
String myline=br.readLine(); 
st=new StringTokenizer(myline); 
Data[Index]=JInteger.parseInt(st.nextToken());// 取 得 输入 值 
} 
catch(IOException ioe) 
{ 
System.out.print("IO error:"+ioe); 


} 
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Index+ 二 十 ; 
}while (Data[Index-1] != 0); // 排 序 前 数据 内 容 
System.out.print(" Before Bubble Sorting :"); 
for ( 1=0 ; i<Index-1 ; !++ ) 
System.out.print(" "+Data[i]+" "); 
System.out.printin(”); 
BubbleSort(Index-1); // 冒 泡 排序 
System.out.print("After Bubble Sorting : "); /排序 后 结果 
for ( 1=0 ; i<Index-1 ; i++ ) 
System.out.print(" "+Datali]+" "); 
System.out.printin( 


public static void BubbleSort(int Index) 


int i,j,K; /循环 变量 
boolean Change; // 数 据 是 否 有 改变 
int Temp; // 数 据 暂 存 变量 
for ( j=Index ; j>1 ; j-- ) /外 层 循环 
Change = false; /设置 为 数据 未 改变 
for ( i=0 ; i<j-1 ; i++ ) /内 层 循 环 
{ if (Data[lit1] < Data[i] ) ”WU 比较 两 数值 
Temp = Datali+1}; 
Datafit+1]} = Datafi]; 
Datall] =Temp,; 
Change = true;”// 设 置 数 据 已 改变 
4 } 
if( Change ) /如 果 数 据 已 改变 则 输出 结果 
{ System.out.print("Current Sorting Result : "); 
/打印 目前 排序 状况 
for ( k=0 ; k<Index ; k++ ) 
System.out.print(" "+Datafk]+" "); 
System.out.printin(""); 


}}} 


4. 冒 泡 排序 的 算法 分 析 
(1) 算法 的 最 好 时 间 复 杂 度 
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右 文 件 的 初始 状态 是 正 序 的 ， 一 趟 扫描 即 可 完成 排序 。 所 需 的 关键 字 比较 次 数 C 和 记 
Cmin=n — ] 
Min=0 
冒 泡 排序 最 好 的 时 间 复 杂 度 为 O(n)。 
(2) 算法 的 最 坏 时 间 复 杂 度 
者 急 始 文件 是 反 序 的 ， 需 要 进行 n - 1 趟 排序 。 每 趟 排序 要 进行 n - i 次 关键 字 的 比较 
(1<i<n - 1D)， 且 每 次 比较 都 必须 移动 记录 三 次 来 达到 交换 记录 位 置 。 在 这 种 情况 下 ， 比 较 
和 移动 次 数 均 达到 最 大 值 : 


Cnax=n(n - 1)2=O(m) 
Mnax=3n(n - 1)2=O(UO] 
冒 泡 排序 的 最 坏 时 间 复 杂 度 为 O(r)。 
(3) 算法 的 平均 时 间 复 杂 度 为 O(n”) z 
虽然 冒 泡 排 序 不 一 定 要 进行 n- 1 趟 ， 但 由 于 它 的 记录 移动 次 数 较 多 ， 故 平均 时 间 性 
能 比 直接 插入 排序 要 差 得 多 。 
(4) 算法 稳定 性 z 
冒 泡 排 序 是 就 地 排序 ， 且 它 是 稳定 的 。 


5. 冒 泡 排 序 的 算法 改进 


上 述 的 冒 泡 排序 还 可 作 如 下 的 改进 。 
“(1) 记 住 最 后 一 次 交换 发 生 位 置 lastExchange 的 冒 泡 排 序 

在 每 趟 扫描 中 ,， 记 住 最 后 一 次 交换 发 生 的 位 置 lastExchange (该 位 置 之 前 的 相 邻 记录 均 
己 有 序 )。 下 一 趟 排序 开始 时 ，R[1……lastExchange - 1] 是 有 序 区 ，R[lastExchange……n] 是 无 
序 区 。 这 样 ， 一 趟 排序 可 能 使 当前 有 序 区 扩充 多 个 记录 ， 从 而 减少 排序 的 趋 数 。 

(2) 改变 扫描 方向 的 彤 泡 排序 

Q) 冒 泡 排序 的 不 对 称 性 

能 一 趟 扫描 完成 排序 的 情况 ， 只 有 最 轻 的 气泡 位 于 R[n] 的 位 置 ， 其 余 的 气泡 均 已 排 好 
序 ， 那 么 也 只 需 一 趟 扫描 就 可 以 完成 排序 。 例 如 ， 对 初始 关键 字 序列 12，18，42，44，45， 
67，94，10 就 仅 需 一 趟 扫描 。 | : 

需要 n - 1 趟 扫描 完成 排序 情况 ， 当 只 有 最 重 的 气泡 位 于 R[1] 的 位 置 ， 其 余 的 气泡 均 
己 排 好 序 时 ， 则 仍 需 做 n - 1 趟 扫描 才能 完成 排序 。 例 如 ， 对 初始 关键 字 序 列 94，10，12， 
18，42，44，45，67 就 需 7 趟 扫描 。 

地 造成 不 对 称 性 的 原因 

每 趟 扫描 仅 能 使 最 重 气泡 “下 沉 ” 一 个 位 置 ， 因 此 使 位 于 顶端 的 最 重 气泡 下 沉 到 底部 
时 ， 需 作 n - 1 趟 扫描 。 
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@ 改进 不 对 称 性 的 方法 
在 排序 过 程 中 交替 改变 扫描 方向 ， 可 改进 不 对 称 性 。 


7.3.2 快速 排序 


1. 基本 思想 


快速 排序 是 C.R.A.Hoare 于 1962 年 提出 的 一 种 划分 交换 排序 。 它 采用 了 一 种 分 治 的 策 
略 ， 通 常 称 其 为 分 治 法 (Divide-and-ConguerMethod)。 分 治 法 的 基本 思想 是 ， 将 原 问 题 分 解 
为 者 干 个 规模 更 小 但 结构 与 诛 问 题 相似 的 子 问题 ， 递 归 地 解 这 些 子 问题 。 然 后 将 这 些 子 问 
题 的 解 组 合 为 原 问 题 的 解 。 因 此 在 用 递归 描述 的 分 治 算法 的 每 一 层 递 归 上 ， 都 有 如 下 3 个 
步骤 。 

步骤 1， 分 解 ; 将 原 问 题 分 解 为 若干 个 子 问题 ， 此 步骤 亦 称 为 划分 ; 

步骤 2， 求解 : 递归 地 解 各 子 问题 ， 若 子 问 题 的 规模 足够 小 ， 则 直接 求解 ; 

步骤 3， 组 合 : 将 各 子 问题 的 解 组 合成 原 问题 的 解 。 | 

设 当 前 待 排 序 的 无 序 区 为 R[low……… high]， 利用 分 治 法 可 将 快速 排序 的 基本 思想 描 
述 为 : 

(1) 分 解 。 在 R[low……high] 中 任 选 一 个 记录 作为 基准 ， 以 此 基准 将 当前 无 序 区 划分 为 
左 、 右 两 个 较 小 的 子 区 间 R[low……pivotpos - 1] 和 R[pivotpos+1……high]， 并 使 左边 子 区 间 
中 所 有 记录 的 关键 字 均 小 于 等 于 基准 记录 (不 妨 记 为 pivot) 的 关键 字 pivotkey， 碳 边 的 子 区 
同 中 所 有 记录 的 关键 字 均 大 于 等 于 pivot.key， 而 基准 记录 pivot 则 位 于 正确 的 位 置 (pivotpos) 
上 ， 它 无 须 参 加 后 续 的 排序 。 因 此 ， 划分 的 关键 是 要 求 出 基准 记录 所 在 的 位 置 pivotpos， 
划分 的 结果 可 以 简单 地 表示 为 (注意 pivot=R{pivotpos]): 

R[low.……*pivotpos-1]).keysR[pivotpos] key 委 R[pivotpos+1.. oe “high]. key 

这 里 low 志 pivotpos 志 high。 / | 

(2) 求解 。 通 过 递归 调用 快速 排序 对 左 、 右 子 区 间 R[low……pivotpos-1] 和 
R[pivotpos+1……high] 排 序 。 

(3) 组 合 。 因 为 当 “ 求 解 ” 步骤 中 的 两 个 递归 调用 结束 时 ， 其 左 、 右 两 个 子 区 间 已 有 
序 ， 所 以 由 上 面 的 不 等 式 立即 知道 整个 数组 R 己 有 序 。 


2. 具体 算法 
按照 快速 排序 的 基本 思想 ， 其 具体 算法 如 下 : 


// 一 一 一 一 一 一 Program Descrition 

/ 程序 名 称 : quicksort.java 

/ 程序 目的 : 使 用 快速 排序 法 设计 一 个 排序 程序 。 
// 


Import Java.util.*; 
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Import java.1o.*; 
public class quicksort 
t 
public static int[] Data = new int[10]， 
public static void main (String args[]) 
人 
int i: // 衢 环 变量 
int Index， /数组 下 标 变 量 ’ 
System.out.Println( "Please input the values you want to sort (Exit for 0):"); 
Index = 0; 
/ 读 取 输入 数据 存 入 数组 中 
InputStreamReader 1s=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is); 
StringTokenizer st; 


do // 读 取 输 入 值 


System.out.print("Data "+Index+" : "); 
tryt{ 
String myline=br.readLine(); 
st=~new StringTokenizer(myline); 
”DatalIndex]Integer.parseInt(st.nextToken());// 取 得 输入 值 
} 
catch(IOException 1o0e) 
System.out.print( "IO error:"+ioe); 


} 


Index+ 十 ; 
}while ( Data[Index-1] != 0); 
/排序 前 数据 内 容 
System.out.print("Before Quick Sorting :"); 
for ( i=0 ; i<Index-1 ; i++ ) 
System.out.print(" "+Data[i}+" "); 
System.out.println(””); 
QuickSort(0,Index-2,Index-1); /快速 排序 
// 排 序 后 结果 
System.out.print(" After Bubble Sorting : "); 
for (1=0 ; i<Index-1 ; i++ ) 
System.out.print(" "+Datafi}+" "); 
System.out.printin(""); 
} 
//-—— 
// 快 速 排序 程序 
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//--———--—— 
public static void QuickSort(int Left,int Right,int Index) 


int ij,k; /循环 变量 

int Pivot: /枢纽 变量 

int Temp: /数据 暂 存 变量 
i= Le 对， 
j= Right-1 
Pivot= Data{Left] .- 

If (1<)) 


} while (Data[i]<=Pivot && i<=Right);// 从 左 向 右 找 比 Pivot 大 的 值 
do 


1--; 
} while (Datafi>=Pivot && i>=Left); /从 右 向 左 找 比 Pivot 小 的 值 
if (i1<)) 
\ 
Temp=Datalfil; 
Datafi]= Datal]}; 
Data[]|=Temp; 
} 
} while (i<j);// 交 换 Data[i] 和 Data[j] 的 值 
if (1>)) 
ft 
Temp=Data[Lef]; /交换 Data[Lefl] 和 Datafj] 的 值 
DatalLeft]= Data[]]; 
Data[}|=Temp; 

// 打 印 目 前 排序 状况 
System.out.print(“"Current Sorting Result : "); 
for ( k=0 ; k<Index ; k++ ) 

System.out.print(" "+Datalk]+" "); 
System.out.println(””); 
和 
QuickSort(Left j-1,Index)， /排序 左边 
QuickSort(j+lrightIndex);， /排序 右边 
上 
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3. 算法 分 析 


快速 排序 的 时 间 主 要 耗费 在 划分 操作 上 ， 对 长 度 为 上 的 区 间 进 行 划分 ， 共 需 -1 次 关 
键 字 的 比较 。 

(1) 最 坏 时 间 复 杂 度 

最 坏 情况 是 每 次 划分 选取 的 基准 都 是 当前 无 序 区 中 关键 字 最 小 (或 最 大 ) 的 记录 ， 划 分 
的 结果 是 基准 左边 的 子 区 间 为 空 (或 右边 的 子 区 间 为 空 )， 而 划分 所 得 的 另 一 个 非 空 的 子 区 
间 中 记录 数目 仅仅 比划 分 前 的 无 序 区 中 记录 个 数 减少 一 个 。 

因此 ,快速 排序 必须 做 n - 1 次 划分 ， 第 1 次 划分 开始 时 区 间 长 度 为 n - 计 ]1， 所 和 需 的 此 
较 次 数 为 n -i(1 专 in - 1)， 故 总 的 比较 次 数 达 到 最 大 值 ; 


= n(n - 1/2=O0DP) 


如 果 按 上 面 给 出 的 划分 算法 ， 每 次 取 当 前 无 序 区 的 第 1 个 记录 为 基准 ， 那 么 当 文 件 的 
记录 已 按 递增 序 (或 递减 序 ) 排 列 时 ， 每 次 划分 所 取 的 基准 就 是 当 前 无 序 区 中 关键 字 最 小 (或 
最 大 ) 的 记录 ， 则 快速 排序 所 需 的 比较 次 数 反而 最 多 。 

(2) 最 好 时 间 复 杂 度 

在 最 好 情况 下 ， 每 次 划分 所 取 的 基准 都 是 当前 无 序 区 的 “中 值 ” 记 录 ， 划 分 的 结果 是 
基准 的 左 、 右 两 个 无 序 子 区 间 的 长 度 大 致 相等 。 总 的 关键 字 比 较 次 数 为 ; 


O(nlgn) 


注意 : 

用 递归 树 来 分 析 最 好 情况 下 的 比较 次 数 更 简单 。 因 为 每 次 划分 后 ， 左 、 右 子 区间 长 度 
大 致 相等 ， 故 递归 树 的 高 度 为 O(lgn)， 而 递归 树 每 一 层 上 各 结 点 对 应 的 划分 过 程 中 所 需要 
的 关键 字 比 较 次 数 总 和 不 超过 n， 故 整个 排序 过 程 所 需要 的 关键 字 比 较 总 次 数 
Cn)=O(nlgn). 


因为 快速 排序 的 记录 移动 次 数 不 大 于 比较 的 次 数 ， 所 以 快速 排序 序 的 最 坏 时 间 复 杂 度 应 
为 O(n”)， 最 好 时 间 复 杂 度 为 O(nlgn)。 

(3) 基准 关键 字 的 选取 

在 当前 天 区 中 先 取 划分 的 划 准 关键 是 决 军法 人 能 的 关键 

(D “三 者 取 中 ”的 规则 

“二 者 取 中 ”规则 ， 即 在 当前 区 间 里 ， 将 该 区 间 首 、 尾 和 中 间 位 置 上 的 关键 字 比 较 ， 
取 三 者 的 中 值 所 对 应 的 记录 作为 基准 ， 在 划分 开始 前 将 该 基准 记录 和 该 区 间 的 第 1 个 记录 
进行 交换 ， 此 后 的 划分 过 程 与 上 面 所 给 的 Partition 算法 完全 相同 。 

多 取 位 于 low 和 high 之 间 的 随机 数 Klow 和 khigm， 用 R[ 且 作为 基准 。 

选取 基准 最 好 的 方法 是 用 一 个 随机 函数 产生 一 个 位 于 low 和 high 之 间 的 随机 数 Kiow 
khigh)， 用 R[] 作 为 基准 ， 这 相当 于 强迫 Rflow……high] 中 的 记录 是 随机 分 布 的 。 用 此 
方法 所 得 到 的 快速 排序 一 般 称 为 随机 的 快速 排序 。 
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注意 : 

随机 化 的 快速 排序 与 一 般 的 快速 排序 算法 差别 很 小 。 但 随机 化 后 ， 算 法 的 性 能 大 大 地 
提高 了 ， 尤 其 是 对 初始 有 序 的 文件 ， 一 般 不 可 能 导致 最 坏 情 况 的 发 生 。 算法 的 随机 化 不 仅 
仅 适 用 于 快速 排序 ， 也 适用 于 其 他 需要 数据 随机 分 布 的 算法 . 


(4) 平均 时 间 复 歼 度 
尽管 快速 排序 的 最 坏 时 间 为 O(n”)， 但 就 平均 性 能 而 言 ， 它 是 基于 关键 字 比 较 的 内 部 排 
序 算法 中 速度 最 快 者 ， 快速 排序 亦 因此 而 得 名 。 它 的 平均 时 间 复 杂 度 为 O(nlgn). 
“(5) 空间 复杂 度 
快速 排序 在 系统 内 部 需要 一 个 栈 来 实现 递归 。 若 每 次 划分 较为 均匀 ， 则 其 递归 树 的 高 
度 为 O(gn)， 故 递归 后 需 栈 空间 为 O(lgn)。 最 坏 情 况 下 ， 递 归 树 的 高 度 为 O(n)， 所 需 的 栈 
空 僻 为 O(n)e 
. (6) 稳定 性 z 
快速 排序 是 非 稳定 的 。 


74 选择 排序 


选择 排序 (Selection Sort) 的 基本 思想 是 : 每 一 趟 从 征 排序 的 记录 中 选 出 关键 子 最 小 的 记 
录 ， 上 顺序 放 在 已 排 好 序 的 子 文件 的 最 后 ， 直 到 全 部 记录 排序 完毕 。 主 要 有 两 种 选择 排序 方 
法 : 直接 选择 排序 (或 称 简 年 选择 排序 ) 和 淮 排 反 。 


7.4.1 直接 选择 排序 


1. 基本 思想 


直接 选择 排序 的 基本 思想 是 : 第 i 趟 排序 开始 时 ,当前 有 序 区 和 无 序 区 分 别 为 
R[1……i- 1] 和 R[i……n](1 志 i 志 n - 1)， 该 趟 排序 则 是 从 当前 无 序 区 中 选 出 关键 字 最 小 的 记 
录 R[ 间 , 将 它 与 无 序 区 的 第 1 个 记录 RE 交换， 使 RE1……i] 和 R[i+1…:…n] 分 别 变 为 新 的 有 序 
区 和 新 的 无 序 区 。 因 为 每 趟 排序 均 使 有 序 区 中 增加 了 一 个 记录 ， 且 有 序 区 中 的 记录 关键 字 


2. 具体 要 法 
“按照 直接 选择 排序 的 基本 思想 ， 其 具体 算法 如 下 ， 


第 7 章 排 序 。173 。 





/一 一 一 一 Program Description 
/程序 名 称 :selectsort.java 

/程序 目的 :使 用 选择 排序 法 设计 一 个 排序 程序 
// 


import java.util.*; 
import java.10.*; 
public class selectsort 
( 
public static int[] Data=new int[10]; 
public static void main (String args[]) 
{ 
int ij /循环 计数 变量 
int Index; /数组 下 标 变 量 
System.out.println("Please input the values you want to sort(Exit for 0):"); 
Index=0;// 数 组 下 标 变 量 初 始 值 
/ 读 取 输入 数据 存 入 数组 中 
InputStreamReader is=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is); 
StrngTokenizer st; 
do 
| 
System.out.print(" Data "+Index+":"); 
try{ 
String myline=br.readLine(); 
st=new StrngTokenizer(myline); 
Data[Index]=Integer.parseInt(st.nextToken0);// 取 得 输入 值 
} 
catch(IOQException ioe) 
{ 
System.out.print("IO error:"+ioe); 


4 


Index+ 十 ; 
}while (Data[Index-1] !=0); 

1/ 排序 前 数据 内 容 
System.out.print(" Before Select Sorting:"); 
for (i=0;i<Index-1;i++) : 

System.out.print(" "+Datali}+" "); 
System.out.println(""); 
SelectSort(Index-1);// 选 择 排 序 

// 排 序 后 结果 
System.out.print("After Select Sorting:"); 
for (i=0;i<Index-1:i++) | 
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System.out.print(" "+Datafi]j+" "); 
System.out.Pprintin(”); 


//---------------------~------------~-~--~--------~------------- 
/直接 选择 排序 
//---------------~--~-----------~---------~-----------~--------- 
public static void SelectSort(int Index) 
\ 
int i,j,k; // 循 环 计 数 变量 
int MinValue: // 最 小 值 变量 
int IndexMin; // 最 小 值 下 标 变 量 
int Temp:; // 暂 存 变 量 
for (1=0;i<Index-1;1it++) 
{ 


MinValue=32767:. /目前 最 小 值 
IndexMin=0: /存储 最 小 值 的 数组 下 标 
forg=ij<Index;j++) 


{ : 站 
iData[jj<MinValue) V/ 找 到 最 小 值 
{ / 
MinValue=Datafj]; /存储 最 小 值 
jndexMin 一 j; | 
| 
Temp=Datali]; /交换 两 数值 
Data[l=Data[IndexMinj; 
DatalIndexMin]=Temp; 
} 
System,out.print( Current sorting result:"); 
for (k=0;k<Index;k++) 
System.out.print(" "+Datafk}+" "); 
System.out.printin(™"'); 
}}} 


3. 直接 选择 排序 的 算法 分 析 


(1) 关键 字 比 较 次 数 
无 论文 件 初始 状态 如 何 ， 在 第 i 趋 排序 中 选 出 最 小 关键 字 的 记录 ， 需 做 n - i 次 比较 ， 
因此 ， 总 的 比较 次 数 为 : 


n(n - 1X2=O(O) 


(2) 记录 的 移动 次 数 
当初 始 文件 为 正 序 时 ， 移 动 次 数 为 0。 文 件 初 态 为 反 序 时 ， 每 趟 排序 均 要 执行 交换 操 
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作 ， 总 的 移动 次 数 取 最 大 值 3(n - 1)。 
直接 选择 排序 的 平均 时 间 复 杂 度 为 O(n7)。 
(3) 直接 选择 排序 是 一 个 就 地 排序 
(4) 稳定 性 分 析 
直接 选择 排序 是 不 稳定 的 。 


7.4.2 ” 堆 排 序 


1. 基本 思想 


堆 排序 是 利用 完全 二 叉 树 进行 排序 的 方法 。 

堆 首先 是 一 棵 完全 二 叉 树 ， 然 后 满足 以 下 条 件 之 一 : 

(1) EK RK; 并 有 Kk 

(2) KK 并 HL Ki>Koin 

堆 有 大 根 堆 ( 根 结 点 的 关键 字 值 最 大 的 堆 ) 和 小 根 扒 ( 根 结 点 关键 字 值 最 小 ) 之 分 。 

堆 排 序 利 用 了 大 根 堆 ( 或 小 根 堆 ) 堆 项 记录 的 关键 字 最 大 (或 最 小 ) 这 一 特征 , 使 得 在 当前 
无 序 区 中 选取 最 大 (或 最 小 ) 关 键 字 的 记录 变 得 简单 。 假 设 使 用 大 根 堆 进行 排序 ， 其 基本 思 
想 是 : 首先 将 初始 文件 RI…… 中 建成 一 个 大 根 堆 ， 此 堆 为 初始 的 无 序 区 ; 将 关键 字 最 大 的 
记录 R[1]( 即 堆 顶 ) 和 无 序 区 的 最 后 一 个 记录 RIn] 交 换 ， 由 此 得 到 新 的 无 序 区 R[1……n- 1] 
和 有 序 区 RIn]， 旦 满足 RI1……n - 1].keys 志 Rfn].keys， 由 于 交换 后 新 的 根 RI1] 可 能 违反 堆 
性 质 ， 故 应 将 当前 无 序 区 R[1……n - 1] 调 整 为 堆 ， 然 后 再 次 将 RE1……n - 1] 中 关键 字 最 大 的 
记录 RI[1]J 和 该 区 间 的 最 后 一 个 记录 RIn - 1] 交 换 ， 由 此 得 到 新 的 无 序 区 RT1……n - 2] 和 
有 序 区 RIn - 1……n], 且 仍 满足 关系 R[1……n - 2].keys 委 Rn - 1……n].keys。 辐 样 要 将 RE1……n 
- 2] 调 整 为 堆 。 重 复 以 上 步骤 ， 直 至 按 关键 字 有 序 。 

由 此 可 抽象 出 大 根 堆 排 序 算 法 的 基本 操作 ， 初 始 化 操作 是 将 R[1…… 四 构造 为 初始 堆 ; 
每 一 趟 排序 的 基本 操作 是 将 当前 无 序 区 的 堆 项 记录 R[1] 和 该 区 间 的 最 后 一 个 记录 交换 ， 然 
后 将 新 的 无 序 区 调整 为 堆 ( 亦 称 重建 堆 )。 显 然 ， 只 需要 做 n - 1 趟 排序 ， 选 出 较 大 的 n - 1 
个 关键 字 即 可 使 文件 递增 有 序 。 用 小 根 堆 排 序 完 全 与 此 类 同 ， 只 不 过 其 排序 结果 是 递减 有 
序 的 。 


2. 具体 算法 
按照 堆 排序 的 基本 思想 ， 其 具体 算法 如 下 : 


/一 一 一 一 一 -Program Description 
/程序 名 称 :Heapsort.java 

1/ 程序 目的 :使 用 堆 排 序 法 设计 一 个 排序 程序 
// 


import java.util.*; 
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import java.io.*; 
public class heapsort 
( 
public static int[] Heap=new int[10];// 堆 数组 
public static void main(String args[|) 
int ij;// 循 环 变量 
int Index:;// 数 组 下 标 变量 
system.out.println("Please Input the values you want to sort(Exit for 0): "); 
Index=1: / 读 取 输入 数据 存 入 数组 中 
InputStreamReader 1S=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(1s); 
StringTokenizer st; 
do // 读 取 输 入 值 
( 
System.out.print("Data "+Index+":"); 
wy{ 
String myline=br.readLine(); 
st=new StringTokenizer(myline); 
Heap[Index]=Integer.parseInt(st.nextToken():// 取 得 输入 值 
catch(IOException loe) 
| System.out.prnt( IO eITOT: "+10€); 
} 
Index++; 
}while (Heap[Index-1] (=0); - 
/排序 前 数据 内 容 
System.out.print("Before Heap Sorting: "); 
for (1=1;i<Index-1;i++) 
System.out.print(""+Heap[i]+ 有 
System.out.println("™"); z 
HeapSort(Index-2); 
/排序 后 数据 内 容 
System.out.print( “After Heap Sorting: "); 
for (1=1;,i<Index-1;i++) 
System.out.print(""+Heap{i}+ ""):; 
System.out.println(””); 
} 
// 
// 建 立 堆 
// 
public static void CreateHeap(int Root,int Index) 


第 7 章 排 序 : .177 。 





int jj;/ 循 环 变量 
int Temp:// 暂 存 变 量 
int Finish;// 判 断 是 否 完成 
j=2*Root;// 子 节点 的 Index 
Temp~Heap[fRoot];// 暂 存 堆 的 Root 值 
Finish=0;// 预 设 堆 尚 未 完成 
While J<=Index && Finish —0) : 
{ 
if (<Index) // 找 最 大 的 子 节点 
if (Heap[j]<Heap[j+1 
j 十 十 ; 
if (Temp>=Heap[)]) 
Finish=1;// 堆 建立 完成 
else 
Heap[j/2]=Heap[j];，W 父 节点 = 目前 节点 
2*#+j; 
上 
Heap[j/2]=Temp;，// 父 节点 =Root 值 
// 
// 堆 排序 
/i 
public static void HeapSort(int Index) 
\ 
int 1,, Temp; 法 . 
// 将 二 又 树 转 成 堆 
for (1=(Index/2),1>=1;1--) 
CreateHeap(i,Index); 
1/ 开始 进行 堆 排 序 
for (i=(Index-1),i>=1,i--) : 
Temp=Heap[i+l1]; / 挫 的 Root 值 和 最 后 一 个 值 交 换 
Heap[i+1]=Heap[{!]; 
Heap[1|]=Temp; 
CreateHeap(1,i);// 对 其 余数 值 重 建 堆 
1/ 打印 堆 的 处 理 过 程 
System.out.print(" Sorting Processing: "); . 
for 0=1:]j<=Index:]j++) : 
System.out.print(""+Heapl}+"™"); 
System.out.printlIn(™™); 


}}} 
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3. 算法 分 析 


堆 排 序 的 时 间 主 要 由 建立 初始 堆 和 反复 重建 堆 这 两 部 分 的 时 间 开 销 构成 ， 它 们 均 是 通 
过 调用 HeapSort 实现 的 。 

堆 排 序 的 最 坏 时 间 复 杂 度 为 O(nlgn)。 堆 排序 的 平均 性 能 较 接 近 于 最 坏 性 能 。 

由 于 建 初始 堆 所 需 的 比较 次 数 较 多 ， 所 以 堆 排 序 不 适宜 于 记录 数 较 少 的 文件 。 

堆 排 序 是 就 地 排序 ， 辅 助 空间 为 0(1)， 它 是 不 稳定 的 排序 方法 。 

堆 排 序 的 时 间 复 杂 度 为 O(nlgn)， 是 一 种 不 稳定 的 排序 方法 。 


7.5 归并 排序 


1. 基本 思想 


归并 排序 是 将 两 个 或 两 个 以 上 的 有 序 表 组 合成 一 个 新 的 有 序 表 。 其 基本 思想 是 : 先 将 
N 个 数据 看 成 入 个 长 度 为 1 的 表 ， 将 相 邻 的 表 成 对 合并 ， 得 到 长 度 为 2 的 N/2 个 有 序 表 ， 
进一步 将 相 邻 的 合并 ， 得 到 长 度 为 4 的 W4 个 有 序 表 ， 以 此 类 推 ， 直 到 所 有 数据 均 合并 成 
一 个 长 度 为 的 有 序 表 为 止 。 每 一 次 归并 过 程 称 做 一 趟 。 


要 解决 归并 问题 , 首先 需要 解决 两 两 归并 问题 (两 个 有 序 表 合并 成 一 个 有 序 表 ). 其 Java 
程序 为 


ff _------------------------- 
/两 两 归并 
//------------------------------------------------------------ 
public static void MergeTwol(int Leftint Middle,int N) 
{ int ij kt /循环 变量 
i=Left: 
k=Left: 
j=Middle+1; // 设 定数 组 指针 
while (i<=Middle && j<=N) W 两 个 欲 合 并 的 数组 均 还 有 值 尚 未 处 理 
{ z 
if (Data[i]<=Datalj]) // 将 较 小 者 先 存 到 输出 数组 
{ Output[k]=Data[i]; : 
1 十 十 ; 
} 
else 
{ Output[k]=Data[]); 
z j++; 
} 
k=k+1; 
} /将 尚未 处 理 完 的 数组 数值 依 序 存 入 输出 数组 
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if (1>Middle) 

{ for (t=j;t<=N,;t++) 
Output[k+t-}j]=Datalt]; 

} 

else 


{ for (t=i:t<=Middle;:t++) 
Output[k+t-j]=Data[t]; 
} } z 


2. 实现 方法 


归并 排序 有 两 种 实现 方法 ， 自 底 向 上 和 自 顶 向 下 。 自 底 向 上 的 基本 思想 是 ;第 1 趟 归 
并 排序 时 ， 将 待 排序 的 文件 R[1……n] 看 作 是 n 个 长 度 为 1 的 有 序 子 文 件 ， 将 这 些 子 文件 两 
两 归并 ， 若 n 为 偶数 ， 则 得 到 n/2 个 长 度 为 2 的 有 序 子 文件 ， 若 n 为 奇数 ， 则 最 后 一 个 子 
文件 轮空 (不 参与 归并 ， 直 接 并 入 下 一 趟 归并 )， 故 本 趟 归并 完成 后 ， 前 w2 - 1 个 有 序 子 文 
件 长 度 为 2， 但 最 后 一 个 子 文件 长 度 仍 为 1; 第 2 趟 归并 则 是 将 第 1 趟 归并 所 得 到 的 n/2 个 
有 序 的 子 文件 两 两 归并 ， 如 此 反复 ， 直 到 最 后 得 到 一 个 长 度 为 美的 有 序 文 件 为 止 。 

以 上 的 算法 也 称 为 二 路 归并 。 但 它 只 是 一 次 合并 ， 要 完成 一 趟 归并 ， 需 要 重复 调用 上 
述 过程 。 
其 程序 实现 为 : 


import java.io.*; 

public class mergesort 

{ public static int[] Data=new int[10]: // 预 设 数 据 数 组 
public static int[] Output=new int[10]; /输出 数据 数组 
public static vold main (String argsf]) 


{ inti; /循环 变量 
int Index; /数组 下 标 变量 
int DataDataLength.; 


System.out.printin("“Please input the values you want to sort(Exit for 0):"); 
Index=0; V1/ 数组 下 标 变 量 初 始 值 
/ 读 取 输入 数据 存 入 数组 中 
InputStreamReader is=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is); 
StringTokenizer st; 
do // 读 取 输 入 值 | 
{ System.out.print("Data "+Index+":"); 
try{ String myline=br.readLine(); . 
Data[fIndex]=Integer.parseInt(myline);// 取 得 输入 值 
和 
catch(IOException ioe) 


{ System.out.print("IO error:"+ioe); 
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Jndex 二 十 ; 

}while (DatalIndex-1]!=0); 

// 排 序 前 数据 内 容 

System.out.print("Before Merge Sorting: 

for (1=0;i<Index-1;1++) 

System.out.print(" "+Data{i]+" "); 

System.out.printIn(™"); 

DataDataLength=]; 

while (DataDataLength < Index) 

{ System.out.printin("Merge Sort DataLength; +DataDataLength) ; 
MergeAll(Index-2,DataDataLength); /归并 排序 
DataDataLength=2*DataDataLength; 

/排序 后 结果 

System.out.print( After Merge Sorting:"); 

for (i=0;i<Index-l;it+) 

System.out.print(" "+Data[i]+" "); 

System.out.printin(""); 


} 
//------------------~-----------~----------~~-----------~------ 
/将 所 有 partition array 分 别 来 两 两 合并 
//-----------------------------------~------------------------- 
public static vold MergeAll(int Nint DataLength) 
{ int i,t: 
1=0; 


/还 有 两 段 长 度 为 Datalength 的 list 可 合并 
while(i<=(N-2*DataLength+1)) 
{ MergeTwoli,itDataLength-1,:1+2*DataLength-1); 
i=1+2*DataLength:; 
} 
if (itDataLength-1<N) 
{ _V 合 并 两 段 list， 一 段 长 度 为 DataLength 的 tist 中 的 值 依次 序 存 到 输出 数组 Output 
MergeTwol(i,i+DataLength:1,N); z 
) 四 
else 
{ for(t=1;t<=N;t++) 
Output[t]=Datalt]; 
} 
// 将 Output 中 的 值 复制 到 Data 
for(t=0;t<=N;t++) 
Dataft}=OQutput[t]; 
System.out.print( current sorting result:"); 
for(i=0:i<=N:it+t) 


第 7 章 排 六 "181 。 


System.out.print(" "+Output[i]+" "); 
System. out. println(™™); 


hh 
3. 算法 分 析 


(1) 稳定 性 

归并 排序 是 一 种 稳定 的 排序 。 

(2) 存储 结构 要 求 | | 

可 用 顺序 存储 结构 ， 也 易于 在 链表 上 实现 。 

(3) 时 间 复 杂 度 

对 长 度 为 n 的 文件 ， 需 进行 | log? | 趟 二 路 归并 ， 每 趟 归并 的 时 间 为 om， 故 其 时 间 复 
杂 度 无 论 是 在 最 好 情况 下 还 是 在 最 坏 情况 下 均 是 Olen). 

(4) 空间 复杂 度 

需要 一 个 辅助 向 量 来 暂 存 两 有 序 子 文件 归并 的 结果 ， 故 其 辅助 空间 复杂 度 为 O(n)， 显 
然 它 不 是 就 地 排序 。 : 


注意 : 
若 用 单 链 表 作 存储 结构 ， 很 容易 给 出 就 地 的 归并 排序 。 


7.6 外 部 排序 


算法 和 数据 结构 的 实现 可 以 基于 主 存储 器 ， 也 可 以 基于 辅助 存储 器 (如 磁盘 和 磁带 等 )， 
但 这 会 影 啊 算法 和 数据 结构 的 设计 。 主 存储 器 和 辅助 存储 器 的 差别 主要 与 存储 介质 中 的 访 
问 速度 、 数 据 的 存储 量 和 数据 的 永久 性 有 关 。 大 多 数 文件 处 理 技术 都 基于 这 样 一 个 基本 事 
实 : 访问 辅助 存储 器 比 访问 主 存储 器 要 慢 很 多 ， 而 外 部 排序 的 过 程 需要 进行 多 次 的 主 存 仿 
名 和 辅助 他 储 名 之 间 的 交换 。 下 面 首先 讨论 对 辅助 存储 器 进行 存 取 的 特点 。 


7.6.1 辅助 存储 器 的 存 取 


1. 磁盘 信息 的 存 取 


磁盘 是 一 种 直接 存 取 的 存储 设备 ， 它 是 以 存 取 时 间 变化 不 大 为 特征 的 。 它 可 以 直接 存 
取 任 何 字符 组 。 它 的 容量 大 、 速 度 快 ， 存 取 速 度 比 磁 带 快 很 多 。 磁 盘 是 一 个 扁平 的 圆 盘 ， 
盘面 上 有 许多 称 为 磁道 的 圆 图， 信息 就 记载 在 磁道 上 。 由 于 磁道 的 圆 图 为 许多 同心 圆 ， 所 
以 可 以 直接 存 取 。 磁 盘 可 以 是 单 片 的 ， 也 可 以 由 若干 盘 片 组 成 盘 组 。 每 一 片上 有 两 个 面 。 

磁盘 驱动 器 执行 读 / 写 信息 的 功能 。 盘 片 装 在 一 个 主轴 上 ， 并 绕 主轴 高 速 旋转 ， 当 磁道 
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在 读 / 写 涉 下 通过 时 ， 便 可 以 进行 信息 的 读 / 写 。 : 

可 以 把 磁盘 分 为 固定 头 盘 和 活动 头 盘 。 固 定 头 盘 的 每 一 道上 都 有 独立 的 磁头 ， 它 是 固 
定 不 动 的 ， 专 负责 读 / 写 某 一 道上 的 信息 。 活 动 头 盘 的 磁头 是 可 移动 的 。 盘 组 是 可 变 的 。 一 
个 面 上 只 有 一 个 磁头 ， 它 可 以 从 该 面 上 的 一 道 移 动 到 另 一 道 。 磁 头 装 在 一 个 动 辟 上， 不同 
面 上 的 磁头 是 同时 移动 的 ， 并 处 于 同一 圆柱 面 上 。 各 个 面 上 半径 相同 的 磁道 组 成 一 个 圆柱 
面 ， 圆 柱 面 的 个 数 就 是 盘 片面 上 的 磁道 数 。 

为 了 访问 一 块 信息 ， 必 须 首 先 找到 柱 面 ， 移 动 臂 使 磁头 移动 到 所 需 柱 面 上 ， 然 后 等 待 
要 访问 的 信息 转 到 磁头 之 下 ， 最 后 是 对 所 需 信息 的 读 / 写 操作 。 所 以 在 磁盘 上 读 / 写 一 块 信 
县 所 需 的 时 间 由 3 部 分 组 成 : 寻 查 时 间 ( 读 / 写 头 定位 的 时 间 )、 下 全 时 同 (得 全 县 闫 的 初始 
位 置 旋转 到 读 / 写 头 下 的 时 间 ) 和 传输 时 间 。 


2. 磁带 信息 的 存 取 


磁带 是 涂 上 薄 薄 一 层 磁 性 材料 的 窗 带 。 磁 带 不 是 连续 运转 的 设备 ， 而 是 一 种 启 停 设 备 
( 启 停 时 间 约 为 Sms)， 它 可 以 根据 读 / 写 的 需要 随时 启动 或 停止 。 一 般 来 说 ， 磁 带 比 磁盘 要 
便宜 许多 。 

磁带 和 磁盘 的 不 同 之 处 是 磁带 只 能 顺序 访问 。 要 想 从 磁带 的 当前 位 置 到 达 目 的 位 置 ， 
必须 正 转 或 反 转 磁带 。 这 使 得 对 于 随机 访问 情况 来 说 ,磁带 慢 得 无 法 接受 。 由 于 读 / 写 信息 
应 在 旋转 稳定 时 进行 ， 因 而 磁带 从 静止 状态 启动 后 ， 要 经 过 一 个 加 速 的 过 程 才能 达到 稳定 
状态 。 同 样 的 道理 ， 读 / 写 操作 结束 时 ， 从 运动 状态 到 完全 停止 要 经 过 一 个 减速 的 过 程 。 这 
伞 ， 殉 必须 使 用 一 个 很 大 的 间隔 了 及 G(Iner Record Gap) 分 开 数 据 ， 以 便 磁 头 能 够 识别 出 一 个 
间隔 。 但 是 ， 在 每 两 条 记录 之 间 放 置 一 个 间隔 就 会 浪费 大 量 的 空间 。 为 了 避免 这 种 浪费 ， 
需要 把 多 条 记录 组 织 到 一 个 块 中 。 这 样 ， 每 个 字符 组 间 就 没有 IRG， 而 变 成 了 块 间 间 隔 
IBG(Iner Block Gap)。 这 样 一 来 ， 通 过 成 块 的 方法 不 仅 可 以 减少 IRG 的 数目 ， 还 可 以 减少 
LO 操作 。 

由 于 磁带 很 便宜 ， 训 度 又 慢 ， 而 且 只 适合 于 顺序 访问 ， 所 以 通常 不 用 它 来 存储 需 要 快 
速 随机 访问 的 数据 。 它 通常 被 用 于 备份 和 归档 。 


3. 缓冲 技术 


由 于 对 辅助 存储 器 进行 读 / 写 操作 相对 于 CPU 的 处 理 速 度 来 说 是 很 慢 的 ， 而 大 多 数 磁 
盘 控制 器 能 独立 于 CPU 进行 操作 。 因 此 ， 为 了 解决 CPU 快 而 VO 慢 的 问题 ， 操 作 系 统合 
用 了 缓冲 技术 。 

(1) 解决 信息 的 到 达 率 和 离 去 率 不 一 致 的 矛盾 。 

“(2) 缓存 起 中 转 站 的 作用 。 

G3) 使 得 一 次 输入 的 信息 能 多 次 使 用 。 

实现 缓冲 技术 的 方式 有 两 种 。 第 1 种 是 在 通道 或 控制 器 内 设置 数据 缓冲 寄存 器 作为 专 
用 便 件 缓冲 器 ， 可 暂 存 IO 信息 ， 2 人 仿 中 疡 CPU 的 次 数 ; 第 2 种 是 在 内 存 中 开辟 出 专 
用 内 存 缓冲 区 ， 作 为 软件 缓冲 。 
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现在 ， 几 乎 所 有 的 操作 系统 都 目 动 进行 扇 区 组 缓冲 ， 而 且 磁 盘 驱 动 器 的 控制 器 硬件 中 
通常 也 直接 建立 而 区 级 缓冲 。 大 多 数 操 作 系统 至 少 维护 两 个 缓冲 区 ,， 一 个 缓冲 区 用 于 输入 ， 
为 一 个 缓冲 区 用 于 输出 。 现 在 ， 操 作 系 统 或 应 用 程序 可 以 在 多 个 组 冲 区 中 存储 信息 。 和 存储 
在 一 个 缓冲 区 中 的 信息 通常 称 为 一 页 ， 这 些 缓冲 区 合 起 来 称 为 缓冲 池 。 缓 冲 池 的 目标 是 增 
加 存储 器 中 存储 的 信息 量 ， 对 于 新 的 信息 请 求 ， 从 缓冲 池 中 得 到 请 求 信息 的 可 能 性 更 大 ， 
而 不 必 册 从 磁 抢 中 读 出 。 


7.6.2 外 部 排序 的 方法 


如 果 操 作 系 统 支持 虚拟 存储 ， 最 简单 的 外 部 排序 方法 是 把 整个 文件 读 入 虚拟 存储 器 
中 ， 然 后 运行 一 个 内 部 排序 方法 ， 例 如 快速 排序 。 如 果 使 用 这 种 方法 ， 虚 拟 存储 管理 器 就 
可 以 使 用 它 的 缓冲 池 机 制 控制 磁盘 访问 。 但 是 ， 这 种 方法 不 总 是 可 行 的 。 一 个 潜在 的 问题 
是 虚拟 存储 器 的 大 小 通常 比 可 用 磁盘 空间 小 得 多 。 这 样 ， 输 入 文件 可 能 无 法 放 到 虚拟 存储 
器 中 。 如 果 调 整 内 部 排序 方法 ， 并 结合 缓冲 管理 技术 之 一 ， 就 可 以 克服 虚拟 存储 器 大 小 的 
限制 。 

调整 内 部 排序 算法 使 之 应 用 于 外 部 排序 ， 这 种 思路 的 更 普遍 的 问题 是 这 样 做 不 可 能 比 
设计 一 个 新 的 尽量 减少 磁盘 存 取 的 算法 更 有 效 。 考 虑 一 下 简单 地 调整 快速 排序 算法 ， 使 之 
用 于 外 部 排序 的 情况 。 快 速 排序 从 处 理 整个 记录 组 开始 ， 第 一 次 划分 把 索引 从 两 端 移 到 内 
部 。 这 可 以 通过 有 效 利用 缓冲 技术 来 实现 。 下 一 步 就 是 处 理 每 一 个 子 记 录 组 ， 接 着 处 理子 
记录 组 的 子 记 录 组 ， 以 此 类 推 。 随 着 子 记录 组 越 来 越 小 ， 处 理 很 快 变 成 对 磁盘 的 随机 访问 。 
即使 TO 操作 可 能 很 有 效 ， 平 均 情况 下 ， 快 速 排序 处 理 每 条 记录 仍然 需要 log 次。 很 快 就 
会 看 到 ， 还 有 比 这 种 方法 更 好 的 方法 。 


1. 二 路 归并 


进行 外 部 排序 的 一 个 更 好 的 方法 源 于 归并 排序 。 归 并 排序 最 简单 的 形式 是 对 记录 顺序 
地 完成 一 系列 扫描 。 在 每 一 趟 扫描 中 ， 妇 并 的 子 列 越 来 越 大 。 而 对 于 外 部 排序 来 说 ， 基 本 
上 有 两 个 相对 独立 的 阶段 组 成 。 首 先 ， 按 可 用 内 存 大 小 ， 将 外 存 上 含 个 记录 的 文件 分 成 
才干 长 度 为 ! 的 子 文件 或 段 (segment)， 依 次 读 入 内 存 并 利用 有 效 的 内 部 排序 方法 对 它们 进 
行 排序 ， 并 将 排序 后 得 到 的 有 序 子 文件 重新 写 入 外 存 。 通 常 称 这 些 有 序 子 文件 为 归并 段 或 
顺 串 ; 然后 对 这 些 归 并 段 进 行 逐 趟 归并 ， 使 归并 段 逐 渐 由 小 到 大 ， 直至 整个 有 序 文件 为 止 。 

二 路 归并 的 算法 如 下 : 

(1) 把 原来 的 文件 分 成 两 个 大 小 相等 的 顺 串 文件 。 

(2) 从 每 个 顺 串 文 件 中 取出 一 个 块 ， 读 入 输入 缓冲 区 中 。 

(3) 从 每 个 输入 缓冲 区 中 取出 第 1 条 记录 ， 把 它们 按照 排 好 的 顺 序 写 入 一 个 顺 串 输出 
缓冲 区 中 。 

(4) 从 每 个 输入 缓冲 区 中 取出 第 2 条 记录 ， 把 它们 按照 排 好 的 顺序 写 入 另 一 个 顺 串 输 
出 缓冲 区 中 。 
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“(5) 在 两 个 顺 串 输出 缓 神 区 之 间 交 替 输 出 ， 重 复 这 些 步骤 直到 结束 。 当 一 个 输入 块 用 
完 时 ， 从 相应 的 输入 文件 读 出 第 二 个 块 。 当 一 个 恒 串 输出 缓冲 区 已 满 时 ， 拒 它 号 回 相 应 的 
输出 文件 。 | 

(6) 使 用 原来 的 输出 文件 作为 输入 文件 ， 重 复 (2) 至 (5) 步 。 在 第 二 是 扫描 中 ， 每 个 输入 
顺 串 文件 的 前 两 条 记录 已 经 排 好 了 次 序 。 这 样 一 来 ， 就 可 以 把 这 两 个 顺 串 归并 成 一 个 长 度 
为 4 个 元 素 的 顺 串 输出 。 

(7) 对 顺 哩 文件 的 每 一 趟 扫描 产生 的 顺 串 越 来 越 大 ， 直 到 最 后 只 剩 下 一 个 顺 串 。 

这 个 算法 可 以 方便 地 使 用 前 面 讲述 的 双 绥 冲 技术 来 实现 。 如 果 一 个 文件 有 n 条 记录 ， 
对 这 个 文件 进行 简单 的 二 路 归并 排序 需要 1gn 趟 扫描 .这样 ， 民 需 要 对 和 条 记录 进行 lg 次 
磁盘 读 / 写 。 所 以 需要 对 二 路 妇 并 算法 进行 优化 。 

虽然 现在 有 很 多 外 部 排序 算法 的 变种 ， 但 六 多 数 变 种 都 依据 同样 的 原理 。 一 般 来 说 ， 
外 部 排序 的 所 有 好 算法 都 基于 下 面 两 步 : 

(1) 把 文件 分 成 大 的 初始 顺 串 。 

(2) 把 所 有 顺 串 归并 到 一 起 ， 形 成 一 个 已 排序 的 文件 。 


2. 置换 选择 排序 


现在 讨论 怎样 为 一 个 磁盘 文件 创建 尽 可 能 大 的 初始 顺 串 的 问题 。 这 里 假定 RAM 大 小 
是 固定 的 。 如 果 分 配给 数组 的 可 用 存储 器 大 小 是 M 条 记录 ， 那 么 就 可 以 把 输入 文件 分 成 长 
度 为 WM 的 初始 顺 串 。 一 种 更 好 的 方法 是 使 用 称 为 置换 选择 的 算法 。 在 平均 情况 下 ， 这 种 算 
法 可 以 创建 长 度 为 2M 条 记录 的 顺 串 。 置换 选择 实际 上 是 堆 排序 算法 的 一 个 微小 变种 。 虽 
然 堆 排序 算法 比 快速 排序 算法 慢 , 但 相对 于 LO 时 间 来 说 是 微乎其微 的 ， 所 以 影响 并 不 大 。 

置换 选择 算法 如 下 (假定 主要 处 理 在 一 个 大 小 为 M 条 记录 的 数组 中 完成 ): 

(1) 从 磁盘 中 读 出 数据 到 数组 中 ， 设 置 LAST=M - 1。 

(2) 建立 一 个 最 小 值 堆 ( 每 个 结 点 中 记录 的 关键 码 值 都 小 于 其 子孙 结 点 中 的 关键 码 值 )。 

(3) 重复 以 下 步骤 ， 直 到 数组 为 空 。 

四 把 具有 最 小 关键 码 值 的 记录 ( 根 结 点 ) 送 到 输出 缓冲 区 。 

外 设 R 是 输入 缓冲 区 中 的 下 一 条 记录 。 如果 R 的 关键 码 值 大 于 刚刚 输出 的 关键 码 值 ， 
则 把 .R 放 到 根 结 点 ， 否 则 使 用 数组 中 LAST 位 置 的 记录 代替 根 结 点 ， 然后 把 R 放 到 LAST 
位 置 ， 并 设置 LAST=LAST - 1。 | 

@) 第 出 根 结 点 ， 重 新 排列 堆 ， 

在 置换 算法 的 开始 ， 几乎 所 有 来 自 输 入 文件 的 值 都 比 这 个 顺 囊 的 最 新 输出 的 关键 码 们 
大 ， 因 为 这 个 顺 串 中 的 初始 关键 码 值 都 很 小 。 随 着 对 顺 串 的 处 理 ， 最 新 输出 的 关键 码 值 变 
得 越 来 越 大 ， 从 而 来 自 输 入 文件 的 新 关键 码 值 很 可 能 太 小 ， 这 些 记录 到 了 数组 的 底部 。 顺 
串 的 总 长 度 预计 是 数组 长 度 的 两 倍 。 / : 


3. 多 路 归并 , 
一 般 的 外 部 排序 算法 在 第 二 阶段 归并 第 一 阶段 创建 的 顺 串 。 如 果 使 用 简单 的 二 路 归 
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并 ,那么 RR 个 顺 串 对 整个 文件 需要 lgn 趟 扫描 。 尽 管 丸 应 当 远 远 小 于 记录 总 数 ( 由 于 每 个 初 
始 顺 串 都 应 当 包 含 许 多 记录 )， 我 们 仍然 希望 进一步 减少 把 顺 串 妈 并 到 一 起 需要 的 扫描 趟 
数 。 二 路 归并 并 不 能 充分 利用 可 用 主 存 。 由 于 归并 是 作用 在 两 个 顺 串 上 的 顺序 过 程 ， 因 此 
每 个 顺 串 一 次 只 ` 而 要 有 一 个 块 的 记录 在 主 存 中 。 这 样 一 来 ， 全 和 生计 的 在 使 用 的 六 多 
数 空间 并 没有 在 妇 并 过 程 中 使 用 。 ” 

如 果 一 次 归并 多 个 顺 串 ， 就 可 以 更 好 地 利用 这 些 空 间 ， 同 时 可 以 大 大 减少 归并 顺 串 需 
要 的 扫描 趟 数 。 

多 路 归并 与 二 路 归并 类 似 。 如 果 有 B 个 顺 串 需要 归并 ， 从 每 个 顺 串 中 取出 一 个 块 放 在 
主 存 中 使 用 ， 那 么 么 B 路 归并 算法 仅仅 查看 中 个 值 (每 个 输入 顺 串 最 前 面 的 值 )， 并 且 选 择 最 
小 的 一 个 输出 。 把 这 个 值 从 它 的 顺 串 中 移出 ， 然 后 重复 这 个 过 程 。 当 任 何 顺 串 的 当前 块 用 
完 时 ， 就 从 磁盘 中 读 出 这 个 顺 串 的 下 一 块 。 / 

一 般 来 说 ， 立 大 的 初 顷 可 以 把 运行 时 间 减少 到 标准 曙 并 反 的 四 分 之 一 使 用 
多 路 归并 可 以 进一步 把 时 间 减 半 。 

四 之 ， 一 种 好 的 外 部 排序 算法 会 尽量 做 好 以 下 几 个 方面 ; 

e 尽量 减少 初始 顺 串 。 

e 在 所 有 阶段 尽 可 能 把 输入 、 处 理 和 输出 进行 并 行 处 理 。 

e 使 用 尽 可 能 多 的 工作 主 存 ， 以 减少 内 外 存 交 换 次 数 ， 达 到 节约 时 间 的 目的 ， 对 外 部 

排序 而 言 ， 更 快 的 CPU 在 运行 时 间 方 面 影响 不 大 。 

e 使 用 多 个 外 存 (最 好 是 随机 存储 设备 )， 使 VO 处 理 具 有 更 大 的 并 行 性 ， 并 允许 顺序 

文件 处 理 。 | > . : / 


7.7 各 种 内 排序 方法 的 比较 和 选择 


在 前 面 几 节 中 介绍 了 几 种 内 排序 的 基本 思想 及 算法 ， 在 实际 应 用 时 到 底 采 用 哪 种 排序 
方法 呢 ? 下 面 将 通过 几 个 标准 来 判断 内 排序 方法 的 性 能 。 

(1) 评价 排序 算法 好 坏 的 标准 

评价 排序 算法 好 坏 的 标准 主要 有 两 条 : 

e 执行 时 间 和 所 需 的 辅助 空间 

e 算法 本 身 的 复杂 程度 

(2) 排序 算法 的 空间 复杂 度 

在 排序 算法 所 需 的 辅助 空间 并 不 依赖 于 问题 的 规模 n， 即 辅助 空间 是 O(1)， 则 称 之 为 
就 地 排序 (In-PlaceSou)。 

非 回 地 排序 一 般 要 求 的 辅助 空间 为 O(n)。 

(3) 排序 算法 的 时 间 开 销 

大 多 数 排序 算法 的 时 间 开 销 主 要 是 关键 字 之 间 的 比较 和 记录 的 移动 。 有 的 排序 算法 的 
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执行 时 间 不 仅 依赖 于 问题 的 规模 ， 还 取决 于 输入 实例 中 数据 的 状态 。 
下 面 从 时 间 和 空间 两 个 方面 比较 各 种 排序 方法 的 优 缺 点 ， 以 便 在 实际 应 用 中 选择 合适 
的 排序 方法 ， 如 表 7-2 所 不 。 


表 7-2 各 种 排序 方法 性 能 比较 表 


排序 方法 和 定性 
oa | on | om | om [or | on 

| 0D | om | om | om | 
WW | om | om | on | oD) | Ne 
入 一 一 十 2 一 一 十 生 一 不 本 
快速 -aum | aum oD | om 不 和 
上 -aum | sum | am | on | 不 本 
月 并 oo 四 | on | om | 稳定 


思考 和 练习 


(1) 试 说 明 希 尔 排 序 的 概念 及 基本 思想 。 
(2) 试 说 明 归 并 排序 的 概念 及 基本 思想 。 
(3) 依次 用 下 面 6 种 排序 算法 对 数组 {44,77,55,99,66,33,22,88,77} 进 行 排序 ， 分 别 手动 
跟踪 它 E 们 的 排序 过 程 。 
冒 泡 排序 
选择 排序 
插入 排序 
归并 排序 
快速 排序 
堆 排 序 
(4) 堆 排 序 与 选择 排序 、 插 入 排序 有 哪些 相似 之 处 ? 
(5) 与 出 下 列 排序 法 的 程序 ， 要 求 排序 结果 按 降 序 排列 。 
e 插入 排序 
e 交换 排序 
e 选择 排序 
e 归并 排序 
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利用 排序 的 方法 实现 查找 满足 不 同 条 件 的 内 容 ， 是 程序 设计 者 必须 掌握 的 。 本 章 着 重 
介绍 几 种 查找 的 方法 ， 程 序 设计 者 可 以 在 实际 的 应 用 过 程 中 灵活 应 用 . 


本 和 章 的 学 习 目 标 : 

e 线性 表 的 查找 方法 ; 

。 二 又 排序 树 的 插入 和 生成 及 其 相应 的 查找 方法 ; 
e B 树 的 插入 和 生成 及 其 相应 的 查找 方法 ; 

e 散 列 函数 的 构造 及 其 查找 算法 。 


8.1 基本 概念 


由 于 查找 运算 的 使 用 频率 很 高， 几乎 在 任何 一 个 计算 机 系统 软件 和 应 用 软件 中 都 会 
及 到 ， 所 以 当 问 题 涉及 的 数据 量 相当 大 时 ， 查找 方法 的 效率 就 显得 格外 重要 。 在 一 些 实 
查询 系统 中 尤其 如 此 。 因 此 ， 本 章 将 系统 地 讨论 各 种 查找 方法 ， 并 通过 对 它 站 的 效率 分 析 
来 比较 各 种 查找 方法 的 优 和 劣 。 加 


1. 查找 表 和 查找 


一 般 地 ， 假 定 被 查找 的 对 象 是 由 一 组 结 点 组 成 的 表 (Table) 或 文件 ， 而 每 个 结 点 则 由 若 
干 个 数据 项 组 成 。 并 假设 每 个 结 点 都 有 一 个 能 惟一 标识 该 结 点 的 关键 字 。 

查找 (Searching) 的 概念 是 ， 给 定 一 个 值 KK， 在 含有 个 结 点 的 表 中 找 出 关键 字 等 于 给 
定 值 天 的 结 点 。 若 找到 ， 则 查找 成 功 ， 返 回 该 结 点 的 信息 或 该 结 点 在 表 中 的 位 置 ， 否 则 查 
找 失败 ， 返 回 相关 的 指示 信息 。 


2. 查找 表 的 数据 结构 表示 


(1) 动态 查找 表 和 静态 查找 表 

者 在 查找 的 同时 对 表 做 修改 操作 (如 插入 和 删除 )， 则 相应 的 表 称 之 为 动态 查找 表 。 和 否 
则 称 之 为 静态 查找 表 。 

(2) 内 查找 和 外 查找 

和 排序 类 似 ， 查 找 也 有 内 查找 和 外 查找 之 分 。 若 整个 查找 过 程 都 在 内 存 进行 ， 则 称 之 
为 内 得 找 ; 反之 ， 兰 查找 过 程 中 需要 访问 外 存 ， 则 称 之 为 外 查找 。 
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3. 平均 查找 长 度 


查找 运算 的 主要 操作 是 关键 字 的 比较 ， 所 以 通常 把 查找 过 程 中 对 关键 字 需 要 执行 的 平 
均 比较 次 数 (也 称 为 平均 查找 长 度 ) 作 为 衡 量 一 个 查找 算法 效率 优 澳 的 标准 。 
平均 查找 长 度 (Average Search Length， ASL) 定 义 为 : 


ASL = > pic, 
i=] 


其 中 , n 是 结 点 的 个 数 。 pi 是 查找 第 i 个 结 点 的 概率 。 若 不 特别 声明 ， 认 为 每 个 结 点 的 
查找 概率 相等 ， 即 p=p2=…=ps=1/n。ci 是 找到 第 i 个 结 点 所 需 进行 的 比较 次 数 。 





8.2 线性 表 查 找 


8.2.1 顺序 查找 
1. 基本 思想 


在 表 的 组 织 方式 中 ， 线 性 表 是 最 简单 的 一 种 。 顺 序 查找 是 一 种 最 简单 的 查找 方法 。 其 
基本 思想 是 ， 从 表 的 一 端 开始 ,顺序 扫描 线性 表 ， 依 次 扫描 到 的 结 点 关键 字 和 给 定 的 玉 什 
相 比 较 ， 若 当前 扫描 到 的 结 点 关键 字 与 天 相等， 则 查找 成 功 ， 若 扫描 结束 后 ， 仍 未 找到 关 
键 字 等 于 天 的 结 点 ， 则 查找 失败 。 四 


2. 顺序 查找 的 存储 结构 要 来 


顺序 查找 方法 既 适用 于 线性 表 的 顺序 存储 结构 ， 也 适用 于 线性 表 的 链 式 存储 结 贞 构 (使 用 
单 链表 作 存储 结构 时 ， 扫描 必 须 从 第 一 个 结 点 开始 )。 | 
向 量 存储 的 线性 表 查 找 包括 对 有 序 表 和 无 序 表 的 查找 。 


3. 具体 算法 
按照 顺序 查找 的 基本 思想 ， 其 具体 算法 如 下 : 


// 一 一 一 一 一 一 一 一 一 Program Descrltlon 

/ 程序 名 称 : lsearch.java 
/程序 目的 ， 设计 一 个 线性 查找 程序 。 

本 

import java.util.*; 

Import Java.10.*; 

public class lsearch 

{ public static int[] Data = 

{ 12,76,29,22,15, 





62,29,58,35,67, 
58,33,28,89,90, 
28,64,48,20,77}; 
public static int Counter=1;// 查 找 次 数 计数 变量 
public static vold main (String args[]) 
{ int KeyValue~=0., 
// 输 入 欲 查 找 值 
System.out.print( Please enter your key value:"); 
// 读 入 输入 数值 
InputStreamReader 1s=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is), 
StringTokenizer st; 
try{ 
String myline=br.readLine(); 
st=new StringTokenizer(myline); 
KeyValue=Integer.parselnt(st.nextToken(O));// 取得 输入 值 
} 
catch(IOException loe) 
t 
System.out.print("IQO error:"+1i0e); 
} /调用 线性 查找 
if (Linear_Search((int) KeyValue)) 
/ { System.out.printIn(""); /输出 查找 次 数 


System.out.printin("Search Time="+(int) Counter): 


‘ System.out,.println(""); // 输 出 没有 找到 数据 
System.out.print("No Found!! "); 


} 
} 
ff 
/顺序 查找 
/f= 
public static boolean Linear Search(int key) 
{ int i;// 数 组 下 标 变 量 
for (1=0;1<20;1++) 
{ ”System.out.print("["+(int) Data[H+"]m9， /输出 数据 
这 (inb key == (int) Data[il) / /得 到 数据 时 
return true;// 返 回 true 
Countert+: /计数 器 递增 
return false; /返回 false 


}} 
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4. 算法 分 析 
成 功 时 的 顺序 查找 的 平均 查找 长 度 为 : 


ASL, = pc = 2 (nitl)=np+(n-D)p,+...+2p,1+p, 
i=] i=] 


在 等 概率 情况 下 ，p 二 1/n(1 志 i 志 n)， 故 成 功 的 平均 宜 找 长 度 为 : 
(nt**+2+1)/n=(n+1)/2 


即 查 找 成 功 时 的 平均 比较 次 数 约 为 表 长 的 一 半 。 

各 天 值 不 在 表 中 ， 则 须 进 行 nt1 次 比较 之 后 才能 确定 查找 失败 。 

顺序 查找 的 优点 是 算法 简单 ， 且 对 表 的 结构 无 任何 要 求 ， 无 论 是 用 向 量 还 是 用 链表 来 
存放 结 点 ， 也 无 论 结 上 之 间 是 否 按 关 键 字 有 序 ， 它 都 同样 适用 。 其 缺点 是 查找 效率 低 ， 
此 ， 当 n 较 大 时 不 宜 采 用 顺序 查找 。 


8.2.2 ”二 分 查找 


1. 基本 思想 


二 分 查找 又 称 折 半 查找 ， 它 是 一 种 效率 较 高 的 查找 方法 。 其 要 求 ， 线 性 表 是 有 序 表 ， 
即 表 中 结 点 按 关键 字 有 序 , 并 且 要 用 向 量 作为 表 的 存储 结构 。 不妨 设 有 序 表 是 递增 有 序 的 。 
二 分 查找 的 基本 思想 是 ， 先 确定 待 查找 记录 所 在 的 范围 (区 间 )， 然 后 逐步 缩小 范围 直 
到 找到 或 找 不 到 该 记录 为 止 。 
(1) 首先 确定 该 区 间 的 中 点 位 置 


mid = (low +high)/2 


(2) 然后 将 竺 得 的 天 值 与 R[mid].key 比较 。 若 相等 ， 则 查找 成 功 并 返回 此 位 置 ， 否 则 
须 确定 新 的 查找 区 间 ， 继 续 二 分 查找 ， 具 体 方法 如 下 : 

(DD 阁 R[mid].key>K， 则 由 表 的 有 序 性 可 知 RImid…nj.keys 均 大 于 KK， 因此 车 表 中 存在 
天 键 子 等 于 天 的 结 点 ， 则 该 结 点 必定 是 在 位 置 mid 左边 的 子 表 R[1…mid - 1] 中 ， 故 新 的 查 
找 区 间 是 左 子 表 R[1…mid - 1]。 

他 类 似 地 ,者 RImid].key<K， 则 要 查找 的 KK 必 在 mid 的 右 子 表 RImid+1…n] 中 ， 即 新 
的 查找 区 间 是 右 子 表 R[mid+1…n]。 下 一 次 查找 是 针对 新 的 查找 区 间 进 行 的 。 

因此 ， 从 初始 的 查找 区 间 R[1…n] 开 始 ， 每 经 过 一 次 与 当前 查找 区 间 的 中 点 位 置 上 的 

结 点 关键 字 的 比较 ， 就 可 确定 查找 是 否 成 功 ， 不 成 功 则 当前 的 查找 区 间 就 缩小 一 半 。 这 
一 过 程 重 复 直 至 找到 关键 字 为 K 的 结 点 ， 或 者 直 全 当前 的 查找 区 间 为 空 ( 即 查找 失败 ) 时 
为 止 。 
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2. 具体 算法 


按照 二 分 查找 的 基本 思想 ， 可 以 采用 非 递 归 方式 设计 二 分 查找 法 ， 也 可 以 采用 递归 方 
式 实现 。 下 面 分 别 加 以 描述 。 
(1) 非 递 归 方式 设计 二 分 查找 法 


/一 一 一 一 一 一 一 一 一 一 Program Discription 
// 程 序 名 称 : bsearch.java 
/程序 目的 : 运用 非 递归 方式 设计 二 分 查找 法 的 程序 。 
/f 
import Java.util,*; 
import Java.i0.*; 
public class bsearch 
{ public static int Max=20; 
public static int[} Data= 
{ 12,16,19,22,25, 
32,39,48,55,57, 
58,63,68,69,70, 
78,84,88,90,97};// 数 据 数组 
public static int Counter=1;// 查 找 次 数 计 数 变 量 
public static vold main(String args[]) 
{ int KeyValue=0; 
System.out.print("Please enter your key value:");， /输入 欲 查找 值 
inputStreamReader is=new InputStreamReader(System.in);。// 读 入 输入 数值 
BufferedReader br=new BufferedReader(is); 
StringTokenizer st; 
try{ String myline=br.readLine(); 
st=new StringTokenizer(myline); 
KeyValue=Integer.parseInt(st.nextTokenO);// 取 得 输入 值 
} 
catch(IOException ioe) 
System.out.print( "IO error:"+ioe):; 
} 
if (BinarySearch((int) KeyValue)) /调用 二 分 查找 
{ System.out.printin(""), 
System.out.printin("Search Time="+(int) Counter);， // 输 出 查找 次 数 
} 


else 
{ System.out.printin(""); z i 
System.out.printin("No Found!4");// 输 出 没有 找到 数据 


[fe 


// 二 分 碍 找 法 


。192。 数据 结构 与 算法 分 析 (Java 版 ) 


//--------------------------------------------- 一 -----------~-- 
public static boolean BinarySearch (int KeyValue) 
{ intLeft， /左边 界 变量 
int Right; // 右 边界 变量 
int Middle; // 中 位 数 变 量 
Left=0; 
Right=Max-1; 
while (Left<=Right) 
{ Middle=(Left+Right)/2; 
iKKeyValue<Data[Middlel]) /和 欲 查找 值 较 小 
Right=Middle-1; /得 找 前 半 段 
else if(KeyValue>DatafMiddle]) /和 欲 查 找 值 较 大 
Left=Middle+1;// 查 找 后 半 段 
else if (KeyValue 一 Data[Middlel) /查找 到 数据 
{ System.out.printin("Dataf"+Middle+"]="+DatafMiddle]); 


return true: 
} 
Countert+t+; 
} 
return false: 


}} 
(2) 递归 方式 设计 二 分 查找 法 


/一 一 一 一 一 -Program Discription 一 一 一 一 一 一 
// 程 序 名 称 : rbsearch.java 
/程序 目的 : 运用 递归 方式 设计 二 分 得 找 法 的 程序 。 
// : 
Import java.util.*,; 
import java.10.*; 
public class rbsearch 
{ public static int Max 一 20; 
public static int[] Data= 
{ 12,16,19,22,25, 
32,39,48,55,57, 
58,63,68,69,70，- 
78,84,88,90,97};// 数 据 数组 

public static int Counter=1;// 查 找 次 数 计数 变量 

public static vold main(String args[]) 

{ int KeyValue=0; z 
System.out.print("Please enter your key value:"); // 输 入 欲 查 找 值 
InputStreamReader is=new InputStreamReader(System.in); // 读 入 输入 数值 
BufieredReader br=new BufteredReaderGs); 

StringTokenizer st; 
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try{: String myline=br.readLine(); 
st=new StringTokenizer(myline); 
KeyValue=Integer.parseInt(st. nextToken()): // 取 得 输入 值 
} 
catch(IOException i0e) 
{ System.out.print("IO error:"+ioe); 
和 
if (BinarySearch((int) KeyValue)) // 调 用 二 分 查找 
{ System.out.println(™"); 
System.eut.printin("Search Time="+(int) Counter)， // 输 出 查找 次 数 
} 


else 
{ System.,out.println(”); / z 
System.out.printin("No Found!!"); // 输 出 没有 找到 数据 


}} z z : 
ff 


/递归 二 分 查找 法 


public static boolean RBinarySearch (int Leftint Rightint KeyValue) 
{ intMiddle: /中 位 数 变 量 
COUTnterf 二 二 ， 
if (Left>Right) 
return false: 
else 
{ Middle={Left+Right)/2: 
if(KeyValue<Data[Middle]) // 欲 可 找 值 较 小 
return RBinarySearch(Left,Middie-1,KeyValue); ”.// 查 找 前 半 段 
else if (KeyValue>Data[Middle]) ， /W/ 欲 查找 值 较 大 
return RBinarySearch(Middlet+1 ,Right,KeyValue); // 查 找 后 半 段 
else 让 (KeyValue==Data[Middle]) ”// 查 找到 数据 
{ System.out.printIn("Data{"+Middlet+"]="+Data[Middlel): 
return true; 
}} 


return false: 


}} 


3. 算法 分 析 


二 分 查找 过 程 可 用 二 又 树 来 描述 : 把 当前 查找 区 间 的 中 间 位 置 上 的 结 点 作为 根 ， 把 左 
子 表 和 和 右 子 表 中 的 结 点 分 别 作为 根 的 左 子 树 和 右 子 树 。 四 记得 到 的 一 义 树 称 为 描述 一 分 碍 
找 的 判定 树 (Decision Tree) 或 比较 树 (Comparison Tree)。 


设 内 部 结 点 的 总 数 为 x=2* - 1, 则 判定 树 是 深度 为 f=lg(0x+1) 的 满 二 叉 树 (深度 及 不 计 外 
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部 结 点 )。 树 中 第 丰 层 上 的 结 点 个 数 为 2“， 查 找 它们 所 需 的 比较 次 数 是 x。 因此 在 等 概率 
假设 下 ， 二 分 查找 成 功 时 的 平均 查找 长 度 为 : 


ASL~lg(n+1)-1 


一 分 查找 在 查找 失败 时 所 需 比较 的 关键 字 个 数 不 超 过 判定 树 的 深度 ， 在 最 坏 情况 下 查 
找 成 功 的 比较 次 数 也 不 超过 判定 树 的 深度 。 即 为 : 


| log: | 十 1 


二 分 查找 的 最 坏 性 能 和 平均 性 能 相当 接近 。 
”虽然 二 分 查找 的 效率 高 , 但 是 要 将 表 按 关键 字 排 序 。 而 排序 本 身 是 一 种 很 费时 的 运算 。 
既 使 采用 高 效率 的 排序 方法 也 要 花费 O(nlgn) 的 时 间 。 / 

二 分 三 找 只 适用 有 顺序 存储 结构 。 为 保持 表 的 有 序 性 ， 在 顺序 结构 里 插入 和 删除 都 必须 
移动 大 量 的 结 点 。 因 此 ， 二 分 查找 特别 适用 于 那 种 一 经 建立 就 很 少 改动 而 又 经 常 需要 查找 
的 线性 表 。 

对 那些 查找 少 而 义 经 常 需 要 改动 的 线性 表 ， 可 采用 链表 作 存 储 结构 ， 进 行 顺序 查找 。 
链表 上 无 法 实现 二 分 查找 。 


8.2.3 ”分 块 查找 


分 块 会 找 义 称 索 引 顺 序 查 找 。 它 是 把 顺序 查找 和 二 分 查找 相 结 合 的 一 种 查找 方法 ， 即 
把 线性 表 分 成 者 干 块 ， 块 和 块 之 间 有 序 ， 但 每 一 块 内 的 结 点 可 以 无 序 。 分 块 查 找 的 基本 思 
想 是 : 确定 被 查找 的 结 点 所 在 的 块 (采用 二 分 查找 法 ) 后 ， 对 该 块 中 的 结 点 采用 顺序 查找 。 

分 块 查找 介 于 顺序 和 二 分 查找 之 间 ， 其 优点 是 ， 在 表 中 插入 或 删除 一 个 记录 时 ， 只 要 
找到 该 记录 所 属 的 块 ， 就 在 该 块 内 进行 插入 和 删除 运算 。 分 块 查找 的 主要 代价 是 增加 一 个 
辅助 数组 的 存储 空间 和 将 初始 表 分 块 排序 的 运算 。 


8.3 ”二 叉 排 序 树 


当 用 线性 表 作 为 表 的 组 织 形 式 时 ， 可 以 用 3 种 查找 法 。 其 中 以 二 分 查找 效率 最 高 。 但 
由 于 二 分 查找 要 求 表 中 结 点 按 关 键 字 有 序 ， 且 不 能 用 链表 作 存 储 结构 ， 因 此 ， 当 表 的 插入 
或 删除 操作 频繁 时 ， 为 维护 表 的 有 序 性 ， 势 必要 移动 表 中 很 多 结 点 。 这 种 由 移动 结 点 引起 
的 额外 时 间 开 销 ， 就 会 抵消 二 分 查找 的 优点 。 也 就 是 说 ， 二 分 查找 只 适用 于 静态 查找 表 。 
若 要 对 动态 查找 表 进 行 高 效率 的 查找 ， 最 好 使 用 二 又 排序 树 。 
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1. 二 又 排序 树 的 基本 概念 


二 叉 排 序 树 (Binary Sort Tree) 义 称 二 又 查找 (搜索 ) 树 或 二 又 分 类 树 ， 它 是 一 种 特殊 的 二 
叉 树 : 或 者 为 空 或 者 满足 下 面 的 条 件 。 

(1) 每 个 结 点 左 子 树 上 的 所 有 结 点 的 关键 字 ， 值 均 小 于 该 结 点 的 关键 字 值 ; 

(2) 每 个 结 点 右 子 树 上 的 所 有 结 点 的 关键 字 ， 值 均 大 于 或 等 于 该 结 点 的 关键 字 值 ， 

(3) 左 、 右 子 树 本 和 喘 又 各 是 一 棵 二 又 排序 树 。 

上 述 性 质 简称 二 又 排序 树 性 质 (BST 性 质 )， 故 二 又 排 序 树 实际 上 是 满足 BST 性 质 的 二 
叉 树 。 


2. 二 又 排 序 树 的 特点 


由 BST 性 质 可 得 : 

(1) 二 又 排序 树 中 任 一 结 点 x， 其 左 ( 右 ) 子 树 中 任 一 结 点 yx( 若 存在 ) 的 关键 字 必 小 (大 ) 于 
x 的 关键 宁 。 

(2) 二 又 排序 树 中 ， 各 结 点 关键 字 是 惟一 的 。 

项 要 注意 的 是 在 实际 应 用 中 ， 不 能 保证 被 查找 的 数据 集中 各 元 素 的 关键 字 互 不 相同 ， 
所 以 可 将 二 又 排序 树 定义 中 BST 性 质 (1) 里 的 “小 于 ” 改 为 “大 于 等 于 ”, 或 将 BST 性 质 (2) 
里 的 “大 于 ” 改 为 “小 于 等 于 ” 甚至 可 同时 修改 这 两 个 性 质 。 

(3) 按 中 序 过 有 历 该 树 所 得 到 的 中 序 序列 是 一 个 递增 有 序 序 列 。 

3. 二 又 排 序 树 的 插入 和 生成 


假若 给 定 一 个 元 素 序列 ， 可 以 利用 上 述 算法 创建 一 棵 二 叉 排 序 树 。 首 先 ， 将 二 叉 树 序 
树 初始 化 为 一 棵 空 树 ， 然 后 逐个 读 入 元 素 ， 每 读 入 一 个 元 素 ， 就 建立 一 个 新 的 结 点 插入 到 
当前 已 生成 的 二 叉 排 序 树 中 ， 即 调用 上 述 二 又 排 序 树 的 插入 算法 将 新 结 点 插入 。 生 成 二 又 
排序 树 的 算法 如 下 。 

已 知 一 个 关键 字 值 为 key 的 结 点 s， 若 将 其 插入 到 二 又 排 序 树 中 ， 只 要 保证 插入 后 仍 
合 二 叉 排序 树 的 定义 即 可 。 揪 入 可 以 用 下 面 的 方法 进行 

(1) 车 二 又 树 序 树 是 空 树 ， 则 key 成 为 二 叉 树 序 树 的 根 ; 

(2) 知 二 又 树 序 树 非 空 ， 则 将 key 与 二 叉 树 序 树 的 根 进行 比较 ， 如 果 key 的 值 等 于 根 
结 点 的 值 ， 则 停止 插入 ， 如 果 key 的 值 小 于 根 结 点 的 值 ， 则 将 key 插入 左 子 树 ， 如 果 key 
的 值 大 于 根 结 点 的 值 ， 则 将 key 插入 右 子 树 。 


具体 算法 如 下 : 
public vold Create(int Data) 
{ int i: // 御 环 计 数 变 量 
int Level=0; 。 ”// 树 的 层 数 
Int Position=0: 


for(i=0;TreeData[i] 1=0;i++); 
TreeData[ 计 =Datai 
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while (true) // 寻 找 结 点 位 置 
{ ifKData>TreeData[Level]) /判断 是 左 子 树 还 是 右 子 树 
f{ ifRightNode[Level] != -1) ”W 判 断 右 子 树 是 否 有 下 一 层 
Level=RightNode[Levell; : 
else z 
{ Position= -1; // 设 定 为 右 子 树 
break: 
} } 
else z 
{ if(LeftNode[Level] != -1) // 判 断 左 子 树 是 否 有 下 一 层 
Level=LeftNode[Levell: 


else 
{ Position= 1; // 设 定 为 右 子 树 
break: 
}}} 
if(Position=—=1) 1/ 判定 结 扩 的 左右 连接 
LeftNode[Level]=i; // 左 连接 : 
ee 的 二 的 二 的 尖 时 
RightNode[Level]=i; // 右 连接 


4. 二 叉 排序 树 的 算法 


实际 上 二 叉 排序 树 的 算法 就 是 一 个 动态 的 查找 过 程 。 其 过 程 可 以 简单 描述 为 ， 在 查找 
某 一 个 值 开 时， 首先 令 天 与 二 叉 树 的 根 结 点 的 值 Rs 进行 比较 ， 如 果 K<R。， 则 在 二 叉 树 的 
左 子 树 上 查找 上 ， 如 果 K 之 Rp， 则 在 二 又 树 的 右 子 树 上 查找 K; 如 果 二 叉 排序 树 中 没有 值 
为 天 的 结 点 ， 则 将 值 为 天 的 结 点 按照 二 叉 排 序 树 构 造 的 规则 插入 到 该 二 叉 树 中。 

其 对 应 算法 主要 分 为 两 步 ， 建 立 二 叉 树 和 对 结 点 的 查找 。 具 体 算法 如 下 : 


/一 一 Program Discriptiorn: 
// 程 序 名称 : btreesearchjava 
/程序 目的 ; 设计 二 叉 排序 树 的 算法 及 程序 。 
| 人 
import java.util.*; 
Import java.10.*; 
public class btreesearch 
{ public static int Max=10; 
public static Int| ] Data= 
{ 15,2,13,6,17, | 
25,37,7,3,18}; /数据 数组 
public static int Counter=1]; 
public static vold main(String args{]) 
{ inti; // 循 环 变 量 
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BNTreeArray BNTree=new BNTreeArray0O; /声明 二 又 数组 
//BNTree.Create(Data[0] 关 Data[O]; 
for (1=0;1<Max;1++) 
BNTree.Create(Data[i]); /建立 二 叉 排 序 树 
System.out.print( "Please enter your key value:"); 
InputStreamReader is=new InputStreamReader(System.in);”// 读 入 数值 
BufferedReader br=new BufferedReader(is); 
StringTokenizer st; 
try{ String myline=br.readLine(}); 
st=new StringTokenizer(myline);, 
KeyValue=Integer.parseInt(st.nextToken();// 取 得 输入 值 
) z 
catch(IOException loe) 
{ System.out.print( "IO error:"+tioe); - 
} 有 
if (BNTree.BinarySearch(KeyValue)>0) /1/ 调 用 二 又 树 查 找 法 
System.out.println("Search Time="+BNTree.BinarySearch(KeyValue)); /输出 查找 次 数 


Else z . 
System.out.printin("No Found11")， /输出 没有 找到 数据 
}} 
class BNTIreeArray 
{ public static int MaxSize=20; 
public static int[] TreeData=new int[MaxSizej; 
public static Int[] RightNode=new int[MaxSize]; . 
public static int[} LeftNode=new int[MaxSize|; 
public BNTreeArray() 
{ int 1; 
for (i=0;1<MaxSize ;i++ ) 
{ TreeDatal[i]=0; 
RightNodefij= -1; 
LeftNode[i]=1; 
} } 
//-----~--------------------------------~--------------------- 
/建立 二 叉 树 
//----------~------------------------------------~---------- 
public vold Create(int Data) 
{ int i; // 循 环 计数 变量 


int Level=0; /1/ 树 的 层 数 

int Position=0; 
for(i=0;TreeDatal[i] 1=0;i++); 
TreeDatafil=Data; | 站 
while (truelj | /寻找 结 点 位 置 
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{ 这 Data>TreeDatafLevel]) /判断 是 左 子 树 还 是 右 子 树 
{( 这 RightNode[Levef := -DJ /判断 右 子 树 是 否 有 下 一 层 
Level=RightNode[Levell]; 
else 
{ Position= -1; // 设 定 为 右 子 树 
break: 
}} 
else 
{ if(LeftNode[Level] != -1) /判断 左 子 树 是 否 有 下 一 层 
Level=LeftNode[Level]; 


else 
{ Position= 1; ”W/W/ 设 定 为 左 子 树 
break; 
} }} : 
if(Position==1) // 判 定 结 点 的 左右 连接 
LeftNode[Level]=i; // 左 连接 
else 
RightNode[Level]=i; // 右 连接 
} 
//----------------~-~~------------------~-~~----------------- 
/二 又 树 查 找 法 
//---------------~--------------------------~----------------- 


public static int BinarySearch(int KeyValue) 
{ ”int Pointer; 。// 现 结 点 位 置 
int Counter; /查找 次 数 


Pointer=0: 
Counter=-0， 
while (Pointer!= -1) 
{Countert+; 
if (TreeData[Pointer] 一 KeyValue) ”// 找 到 了 和 欲 查找 的 结 点 
return Counter:; // 返 回 查 找 侈 数 


else if (TreeData[fPointer]>KeyValue) 
Pointer=LeftNode[Pointer]; 。“// 找 左 子 树 
else 
Pointer=RightNode[Pointer];  // 找 右 子 树 


} 
return 0: // 该 结 扩 不 在 此 二 叉 树 中 
}} 
5. 算法 分 析 


在 二 又 排序 树 上 进行 查找 时 ， 若 查找 成 功 ， 则 是 从 根 结 点 出 发 走 了 一 条 从 根 到 待 查 结 
所 的 路 径 。 春 查找 不 成 功 ， 则 是 从 根 结 点 出 发 走 了 一 条 从 根 到 某 个 叶子 的 路 径 。 
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(1) 二 又 排序 树 碍 找 成 功 的 平均 碍 找 长 度 
在 等 概率 假设 下 ， 二 叉 排 序 树 查 找 成 功 的 平均 查找 长 度 为 ; 


ASL = > pe, 
! 


(2) 在 二 又 排序 树 上 进行 查找 时 的 平均 查找 长 度 和 二 叉 树 的 形态 有 关 

二 分 查找 法 查找 长 度 为 n 的 有 序 表 ， 其 判定 树 是 惟一 的 。 含 有 nn 个 结 点 的 二 叉 排 序 树 
却 不 惟一 。 对 于 含有 同样 一 组 结 点 的 表 ， 由 于 结 点 插入 的 先后 次 序 不 同 ， 所 构成 的 二 又 排 
序 树 的 形态 和 深度 也 可 能 不 同 。 

e 在 最 坏 情 况 下 ,二 又 排序 树 是 通过 把 一 个 有 序 表 的 n 个 结 点 依次 插入 而 生成 的 ， 此 
时 所 得 的 二 文 排序 树 赔 化 为 深度 为 n 的 单 支 树 ， 所 的 平 淘 盐 找 长 度 和 单 链表 上 的 顺 
序 查 找 相同 ， 认 是 (n+1)/2。 

e 在 最 好 情况 下 ， 二 又 排序 树 在 生成 的 过 程 中 ,， 树 的 形态 比较 匀称 ， 最终 得 到 的 是 一 
棵 形态 与 二 分 查找 的 判定 树 相似 的 二 叉 排序 树 , 此 时 它 的 平均 查找 长 度 大 约 是 lgn。 

e 插入 、 删 除 和 查找 算法 的 时 间 复 杂 度 均 为 O(lgn)。 

(3) 二 叉 排 序 树 和 二 分 查找 的 比较 

束 平 均 时 间 性 能 而 言 ， 二 又 排 序 树 上 的 查找 和 二 分 查找 差不多 。 

就 维护 表 的 有 序 性 而 言 ， 二 又 排 序 树 无 须 移 动 结 点 ， 只 需 修改 相关 值 即 可 完成 插入 和 
删除 操作 ， 且 其 平均 的 执行 时 间 均 为 O(lgn)， 因 此 更 有 效 。 二 分 查找 所 涉及 的 有 序 表 是 一 
个 同 量 ， 者 有 插入 和 删除 结 点 的 操作 ， 则 维护 表 的 有 序 性 所 花 的 代价 是 O(n)。 当 有 序 表 是 
静态 查找 表 时 ， 宜 用 问 量 作为 其 存储 结构 ， 而 采用 二 分 查找 实现 其 查找 操作 ， 若 有 序 表 为 
动态 查找 表 ， 则 应 选择 二 又 排序 树 作 为 其 存储 结构 。 

(4) 平衡 二 又 树 

为 了 保证 二 又 排 序 树 的 高 度 为 lgx， 从 而 保证 二 叉 排 序 树 上 实现 的 插入 、 删 除 和 查找 
等 基本 操作 的 平均 时 间 为 O(ign)， 在 往 树 中 插入 或 删除 结 点 时 ， 要 调整 树 的 形态 来 保持 树 
的 “平衡 ”。 使 之 既 保 持 BST 性 质 不 变 又 保证 树 的 高 度 在 任何 情况 下 均 为 lgnx， 从 而 确保 
树 上 的 基本 操作 在 最 坏 情 况 下 的 时 间 均 为 O(ign)。 逢 要 说 明 的 是 : 

e 平衡 二 又 树 (Balanced Binary Tree) 是 指 树 中 任 一 结 点 的 左右 子 树 的 高 度 大 致 相同 。 

e 任 一 结 点 左右 子 树 的 高 度 均 相 同 (如 满 二 叉 树 )， 则 二 叉 树 是 完全 平衡 的 。 通 常 ， 只 

要 二 又 树 的 高 度 为 lgn， 就 可 看 作 是 平衡 的 。 
e 平衡 的 二 又 排序 树 指 满足 BST 性 质 的 平衡 二 叉 树 。 


8.4 B 树 





对 于 计算 机 系统 来 说 , CPU(Centre Processing Unit) 处 理 数据 的 速度 是 微 秒 级 或 纳 秒 级 ， 
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比 磁 盘 或 磁带 快 百 万 倍 ， 甚 至 更 快 ， 而 数据 库 程 序 中 大 部 分 信息 都 存储 在 磁盘 或 磁带 上 ， 
这 样 辅 存 上 的 信息 处 理会 显著 地 降低 程序 的 执行 速度 。 因 此 对 基于 磁盘 或 磁带 的 数据 进行 
有 效 的 检索 时 ,选择 正确 的 数据 结构 以 大 大 减少 访问 这 些 辅 存 的 时 间 代 价 就 显得 非常 重要 ， 
而 B 树 就 是 这 样 的 方法 。 

1. m 路 查找 树 


与 二 又 排序 树 类 似 ， 可 以 定义 一 种 “mm 叉 排序 树 ”， 通 常 称 为 m 路 查找 树 。 
-- 棵 性 路 查找 树 ， 或 者 是 一 棵 空 树 ， 或 者 是 满足 如 下 性 质 的 树 ; 
结 点 最 多 有 m 个 子女 ，m - 1 个 关键 字 。 

每 个 结 点 中 的 值 是 按 升序 排列 的 。 

前 i 个 子女 的 值 比 第 i 个 值 小 。 

后 m-i 个 子女 的 值 比 第 i 个 值 大 。 

如 图 8 - 1 所 示 是 一 棵 3 路 查找 树 。 


加 对 
可 加 到 了 本 


20 |24 32 |36 | 48 | 50 
图 8-1 3 路 查找 树 


为 了 更 好 地 学 习 B 树 ， 下 面 首先 讨论 3 路 查找 树 的 查找 和 插入 ， 
(1) 平衡 3 路 查找 树 及 其 查找 

由 m 路 查找 树 的 性 质 我 们 很 容易 得 出 3 路 查找 树 的 特征 : 

。 一 个 结 点 包含 一 个 或 两 个 关键 码 。 

。 每 个 内 部 结 点 最 多 有 3 个 子女 。 

e 所 有 叶 结 点 都 在 树 的 同一 层 ， 因 此 树 的 高 度 总 是 平衡 的 。 
平衡 3 路 查找 树 的 Java 类 说 明 如 下 : 


class TTNode { 
private Elem lkey; 
private Elem rkey:; // 结 点 的 左右 值 
private int numKeys;  /W// 结 点 存储 值 的 数量 
private TTNode left; 
private TTNode center; 
private TTNode right; ”1/ 结 点 的 顽 、 .中 、 右 子 树 
public TTNode() {center=left=right=null. numkeys=0; } 
public TTNode(Elem l,Elem r,TTNode pl,TTNode p2,TTNode p3){ 
lkey=l;rkey=r; 
if (r—null) 
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numkeys=1; 
else 
numkeys=2; 
left=p1; 
center=p2, 
right=p3 
} 
// 结 点 内 部 增加 值 和 子 树 / 
public void addK ey(Elem val, TTNode child) { 
Assert.notFalse(numKeys==1, lllegal addkey”); 
numKeys=2 
if (val,key(O<!key.keyO) { 
rkey=Ilkey; 
lkey=val; 
right=center; 
center=child;: 
public int num eys() {return numK eys;} 
public TTNode lchild() {return left;) 
public TTNode rchild() {return right;} 
public TTNode cchild0) {return center;} 
public Tmode setCenter(TTNode val) {return center=val;} 
public Elem lkey() {return lkey;} 
public Elem rkey() {return rkey;} 
: _public boolean isLeaf() {return left—null;} 
/修改 结 点 的 左 值 
public void setLkey(Elem val) { 
Assert.notFalse(val!=null,”Can’t nullify left value’”’); z 
Lkey=val; 四 
和 
// 收 改 结 点 的 石 值 
public void setRkey(Elem val) { 
AssertnotFalse(val!=0，Can't set right key of empty node”); 
tf ((val==null)&&(numKeys=—2)) { 
{right=null; numKeys=1;} 
rkey=val; 
} 
} 


3 路 查找 树 的 查找 过 程 与 二 叉 排序 树 的 查找 过 程 类 似 。 查 找 从 根 结 点 开始 ， 如 果 根 结 
点 不 包含 查找 关键 码 ， 就 在 可 能 包含 关键 码 的 子 结 点 中 继续 查找 。 具 体 算法 如 下 ; 


private Elem TTsearch(Ttnode root, int val) { 


if (root—=null) return null; // 根 为 空 ， 值 未 找到 / 
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if (val==root.lKey().Key()) 


return root.lkey(); 
if ({root.numKeys().keyO)==2) && (val==root.rkey().keyO)) 
return root.rkey(); // 根 不 空 ， 值 找到 
if (val<root.lkey(}.keyO) /查找 左 子 树 
return TTsearch(root.lchild(),val); 
else if (root.numKeys(}=—=1) // 查 找 中 子 树 
return TTsearch(root.cchild(),val): 
else if (val<root.rkey().KeyO) z 1/ 查找 中 子 树 
return T Tsearch(root.cchild(),val); - 
else // 但 找 右 子 树 


return T'search(root.rchild(),val); 


} 


(2) 3 路 查找 树 的 插入 和 生成 

回 一 个 3 路 查找 树 插入 记录 类 似 于 向 一 个 BST 插入 记录 , 新 记录 也 放 到 相应 的 叶 结 点 
中 。 与 BST 插入 记录 不 同 ，3 路 查找 树 并 不 创建 新 的 子女 结 点 放置 插入 的 记录 。 如 果 关 键 
码 在 树 中 ， 第 一 步 是 找到 将 会 包含 这 个 关键 码 的 叶 结 点 。 如 果 这 个 叶 结 点 只 包含 一 个 值 ， 
则 不 需要 对 树 进行 修改 就 可 以 把 新 关键 码 添加 到 这 个 结 点 中 。 如 果 这 个 时 结 点 已 经 包含 两 
个 关键 码 ， 则 需要 创建 更 多 的 空间 。 这 时 必须 从 空闲 存储 区 中 创建 一 个 新 结 点 ， 将 原 结 点 
中 的 两 个 关键 码 值 和 新 关键 码 值 中 最 小 的 一 个 放 入 原 结 点 ， 最 大 的 一 个 放 入 新 结 点 ， 而 中 
间 的 关键 码 值 与 指向 新 结 点 的 指针 传 回 到 父 结 点 。 这 称 为 一 次 提升 。 如 果 父 结 点 只 包含 一 
个 关键 码 值 ， 则 直接 将 传 回 的 中 间 关 键 码 值 插 入 ;如 果 父 结 点 已 包含 两 个 关键 码 值 ， 则 就 
重复 提升 过 程 。 具 体 Java 实现 如 下 : 


private Object[] 工 Tcreate(TTITNode rt, Elem val) { 


if (t==null) { // 根 结 点 为 空 
rt=new TTNode(val,nvli,null,,null,nul]): 

Object[] temp={rt} 

} 

if (rt.isLeaf()) - // 在 叶 结 点 插入 


if (rt.numKeys()=—1) 
{rt.addKey(val,null); return null.} 
else return splitnode(rt,val,null): 
// 在 结 点 内 部 
Object[] retval; 
if (val.keyO<rt.lkey().keyO) 
retval=Ttcreate(rt.1child().val): 
else if ((rt.numKeys()==1) || (val.keyO<rt.rkeyO.keyO)) 
retval=Ttcreate(rt.cchild(),val); 
else retval=Ttecreate(rt.rchild(),val); 
if (retyval=—null) return null; 
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// 分 裂 子 结 所 
if (rt.numkeys()==1) { 
rt. addKevy((Elem)retvalf0] (TTNode)retvall ]); 
return null; 
} 
// 同 时 分 裂 当前 结 操 
return splitnode(rt,(Elem)retvalf0],(TTNode)retval[ 1)); 
} 
/分 机 一 个 结 点 
Object{] splitnode(TTNode rt, Elem val TINode child) { 
Object[] temp= new Oblect[21; 
if (val.keyO>rt.rkey(O.keyO0) { ”WU/ 比 结 点 右 值 大 
temp[0]=rt.rkey(); // 提 升 右 值 
TTNode hold=rt.rchild; : 
rt.setRkey(null); 
temp[]1]=new TTNode(val,null,hold,child,nul}l); 
+ 
else if (val.keyO>rt.lkeyO.key0) { W 比 结 点 左 值 大 


temp[0]=vai; 1/ 提升 得 插入 值 
temp[l]=new TTNode(rt.rkeyO,null,child,rt. rehildO,null); 
rt.setRkey(nuil); . 

} . 

else { // 比 结 点 左 值 小 
temp[0]=rt.Jkey0; /提升 左 值 


temp!ll]=new TINode(rt.rkeyO,nullrtcchild,rtrchildO,null; 
rt.setCenter(child); : 
rt.setLkey(val); 
rt.setRkey(null); 
} 
return temp; ” /返回 提升 的 关键 码 值 和 它 的 子 树 
} 


2. B 树 及 其 查找 


(1) B 树 的 基本 概念 

一 棵 B 树 是 一 棵 平衡 的 m 路 查找 树 ，B 树 的 研究 通常 归功 于 R.Bayer 和 E.McCreight， 
他 们 在 1972 年 的 论文 中 描述 了 B 树 。 到 1979 年 ，B 树 几 乎 已 经 替代 了 除 散 列 方法 以 外 的 
所 有 大 型 文件 访问 方法 。B 树 的 一 个 重要 属性 是 每 个 结 点 的 大 小 可 以 和 磁盘 或 磁带 中 的 一 
个 块 的 大 小 相同 ， 所 以 卫 树 涉及 了 当 实现 基于 磁盘 或 磁带 的 查找 树 时 遇 到 的 所 有 问题 

一 棵 B 树 或 者 是 空 树 ， 或 者 是 满足 如 下 性 质 的 树 ; 

e 树 中 每 个 结 点 最 多 有 m 棵 子 树 ; 


e 根 结 扩 至 少 有 两 棵 子 树 ; 
e 除根 结 反之 外 的 所 有 非 叶 结 点 至 少 有 2] 棵 子 机 
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所 有 叶 结 扣 出 现在 同一 层 上 。 


B 树 是 平衡 二 又 排序 树 或 3 路 查找 树 的 一 种 推广 ， 从 另 一 方面 来 说 ， 平 衡 二 又 排序 树 
是 一 个 2 阶 B 树 ， 平 衡 3 路 查找 树 是 一 个 3 阶 B 树 ， 
(2) B 树 的 查找 
B 树 的 查找 是 平衡 3 路 查找 树 的 查找 算法 的 一 种 推广 ， 它 是 一 个 交替 的 两 步 过 程 
要 的 区 别 是 在 当前 结 点 查找 时 使 用 二 分 查找 算法 。 
给 定 关键 码 值 x， 为 了 在 m 阶 B 树 中 查找 对 应 记录 ， 具 体 算 法 如 下 : 


如 果树 为 空 ， 返 回 null。 

令 x 为 根 结 点 。 

重复 步骤 (4) 至 (6)， 直至 x 为 叶 结 点 。 

在 结 点 x 使 用 二 分 查找 算法 查找 关键 码 值 K;， 使 得 Ki<k 委 天 (Ko= - ce ，Ko=+co)。 
如 果 K; =k， 人 磁 副 读 取 相 应 记录 并 返回 之 盏 则 执行 (6)。 

Pi 为 x 结 点 重复 (4)(5) 

租 找 失败 返回 null。 


G) B 树 的 插入 和 生成 
同样 ，B 树 的 插入 和 生成 也 是 平衡 3 路 查找 树 的 插入 和 生成 算法 的 一 种 推广 。 
给 定 关键 码 值 ， 为 了 在 加 阶 B 树 中 插入 对 应 记录 ， 具 体 算法 如 下 : 


如 果树 为 空 ， 创 建 一 个 带 有 两 个 空 叶 结 点 的 树 根 将 插入 到 根 结 点 上 ， 并 返回 
True( 表 示 揪 入 成 功 )。 

令 x 为 根 结 点 。 

重复 步骤 (4) 至 (6)， 直至 x 为 叶 结 点 。 

人 在 结 反 x 使 用 二 分 查找 算法 查找 关键 码 值 K,， 使 得 Ki1<k 志 Ki (Ko=- ce， 天 =+co)。 
如 朱 K; =k， 返 回 False( 表 示 揪 入 失败 ， 因 为 已 经 存在 一 个 惟一 的 大 值 )。 

令 x 为 子 树 $ 的 根 结 点 。 - 

将 记录 存 入 磁盘 或 磁带 。 

在 结 反 x 的 关键 码 值 Kl 和 KK 之 间 插 入 人 作品 村 的 磁盘 也。 

在 结 点 x 加 入 一 个 空 叶 结 点 。 

如 果 当 前 树 高 degree(x)=m， 重 复 步 又 (11) 至 (13) 直 到 degree(x)<m。 


令 包 为 结 点 x 的 中 间 关 键 码 值 。 - 
从 x 中 将 K 移出 将 使 原来 的 关键 码 信 分 为 两 部 分 , 令 w 和 v 分 别 为 左 、 右 部 分 。 


如 果 结 点 x 为 根 结 点 ， 创建 一 个 包含 多 并 且 以 w 和 vw 为 左右 子 树 的 新 根 结 点 。 
否则 ， 将 态 插 入 到 zx 的 父 结 点 中 并 维护 父 结 点 同 u、 vy 的 连接 。 
返回 True。 


从 上 述 B 树 的 构造 过 程 可 得 出 以下 结论 : 


由 于 B 树 是 “从 叶 往 根 ”长 ， 而 根 对 每 个 分 支 是 公用 的 ， 所 以 不 论 根 长 到 多 < 深 ?， 
各 分 文 的 长 度 同 步 增 长 ， 因 而 各 分 支 是 “平衡 ”的 。 
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e 生长 的 几 种 情况 : 

e 最 底层 某 个 结 点 增 大 ， 分 支 数 不 变 ， 且 各 分 支 深度 也 不 变 。 

e 从 最 下 层 开 始 ， 发 生 单 次 或 连续 分 裂 ， 但 根 结 点 未 分 裂 ， 此 时 分 支 数 增 1( 最 下 层 

“” 结 反 增 1)， 但 原 分 支 深度 不 变 ， 新 分 支 深度 与 原 分 支 相同 。 

e 从 最 下 层 开 始 ， 连 续 分 裂 ， 根 结 点 也 发 生 分 裂 ， 产 生 一 个 新 的 根 结 点 ， 此 时 分 支 数 

仍 增 1( 最 下 层 结 点 增 1 )， 但 新 、 提 分 支 均 为 原 分 支 长 度 加 1。 z 

根据 B 树 的 定义 ， 必须 保证 B 树 半 满 ， 因 此 可 能 有 50% 的 空间 被 浪费 。 如 果 经 常 发 生 
这 种 情况 ， 则 必须 重新 考虑 这 个 定义 或 者 对 B 树 增 加 其 他 的 限制 。 一 般 情况 下 ，B 树 大 约 
69% 满 ， 不 太 可 能 全 部 放 满 ， 所 以 最 好 再 有 一 些 附加 约束 。 


3. B 树 家 族 


(1) B* 树 

因为 B 树 中 的 每 个 结 点 都 代表 了 一 个 辅 存 块 ,访问 一 个 结 点 就 意味 着 一 次 辅 存 的 存 取 ， 
这 相对 于 主 存 中 结 点 的 访问 来 说 ， 代 价 太 大 。 所 以 ， 创 建 的 结 点 越 少 越 好 。 

一 个 B* 树 是 B 树 的 衍生 物 ， 它 由 Donald Knuth 提出 ， 由 Douglas Comer 命名 。 在 一 
个 B* 树 中 ， 除 了 根 的 所 有 结 点 都 需要 三 分 之 二 满 ， 而 不 像 B 树 中 的 半 满 。 更 精确 地 说 ， 
所 有 m 阶 的 B 树 的 非 根 结 点 中 的 关键 码 数 是 (2m - 1)/3 - 1<k<m - 1。 结 点 分 裂 的 频率 通过 
延迟 结 扩 分 裂 而 降低 ， 当 时 机 到 来 时 ， 也 是 将 两 个 结 点 分 成 三 个 结 点 ， 而 不 是 一 个 分 成 两 
个 。B* 树 的 平均 利用 率 大 约 为 81%。 

(2) B 树 

由 于 一 棵 B 树 的 结 点 代表 了 一 个 辅 存 块 , 从 一 个 结 点 到 另 一 个 结 点 需要 费时 的 块 切 换 ， 
所 以 ， 最 好 是 尽 可 能 地 少 访问 结 点 。 如 果 请 求 以 升序 访问 B 树 中 的 结 点 会 怎么 样 呢 ?可 以 
用 龟 于 实现 的 中 序 遍 历 ， 但 是 对 非 末端 结 点 ， 一 次 只 能 显示 一 个 键 ， 然后 就 要 访问 其 他 的 
块 了 。 因 此 ， 我 们 更 希望 能 增强 B 树 ， 以 便 能 以 比 中 序 遍 历 快 的 方式 顺序 访问 数据 。B+ 
树 就 提供 了 一 个 解决 方案 。 四 

B 树 和 BST 及 前 面 介 绍 的 3 路 查找 树 最 显著 的 差异 是 B 树 只 在 叶 结 点 存储 记录 。 内 
部 结 反 存储 关键 码 值 ， 但 这 些 关 键 码 值 只 是 占据 位 置 ， 用 于 引导 查找 ， 这 意味 着 内 部 结 点 
在 结构 上 与 叶 结 点 有 着 显著 的 差异 。 内 部 结 点 存储 关键 码 来 引导 查找 ， 把 每 个 关键 码 与 指 
同 子女 结 点 的 指针 关联 起 来 ， 叶 结 点 存储 实际 记录 。 


8.5 散 列 技术 





1. 散 列 表 的 概念 


(1) 散 列 (HASH) 表 的 定义 | | 
车 一 个 结 点 在 表 中 的 位 置 和 该 结 点 的 关键 字 之 间 不 存在 确定 的 关系 ， 则 在 表 中 查找 某 
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结 点 时 必然 要 进行 天 键 字 的 比较 ， 人 否则 不 然 。 

通常 情况 下 ， 真 正 要 存储 的 关键 字数 目 比 可 能 的 关键 子 总 数 少 得 多 。 即 实际 发 生 的 关 
键 字 集合 往往 是 所 有 可 能 取 值 的 关键 字 集 合 的 一 个 很 小 的 子 集 。 若 要 使 用 直接 寻 址 ， 就 必 
须 为 每 个 可 能 的 关键 字 在 同 量 空间 中 保留 一 个 位 置 。 因 此 ， 最 保守 的 估计 是 向 量 空间 的 大 
小 为 关键 字数 目 足 以 满足 实际 的 需求 。 

将 所 有 可 能 出 现 的 关键 字 集 合 记 为 U， 简 称 全 集 ， 实 际 发 生 即 实际 存储 的 关键 字 和 集合 
记 为 KK。 

虽然 直接 寻 址 技术 可 在 OG) 时 间 内 存 取 表 中 的 任 一 结 点 ， 但 它 有 一 个 致命 的 缺陷 当 
U 很 大 时 ， 要 存储 一 个 规模 为 |U| 的 表 了 是 不 实际 的 , 有 时 甚至 是 不 可 能 的 ， 这 是 因为 | 可 
可 能 远 迅 大 于 主 存 的 容量 。 既 使 |UI 不 太 大 , 但 只 要 | 名 比 |UI 小 得 多 时 ,TT 的 大 部 分 空间 亦 被 
良 帝 ， 此 时 了 是 一 个 黎 朴 表 。 因 此 ， 必 须 将 了 的 空间 压缩 至 O( 允 的 规模 ， 但 这 样 直接 寻 
址 技术 了 怠 可 能 不 再 适用 了 。 我 们 必须 在 关键 字 和 表 地 址 之 间 建 立 一 个 对 应 关系 h， 它 将 全 
集 U 映射 到 表 Tf0…m - 1] 的 下 标 集 上 (这 里 m=O(|K)。 


hn: U->140, ] ， 2， ”9 m-— 1} 


通常 称 h 为 散 列 孙 数 ，T 为 散 列 表 。 对 于 任意 的 关键 字 KiE U， 包 含 此 关键 字 的 结 点 
被 存 储 在 表 了 的 PKD 位 置 上 ， 也 就 是 说 散 列 函数 的 自 变 量 是 U 中 的 关键 字 ， 函 数值 为 相 
应 结 点 的 存储 地 址 ( 亦 称 散 列 值 或 散 列 地 址 )。 将 结 点 按 其 关键 字 的 散 列 地 址 存储 到 散 列 表 
中 的 过 程 称 为 散 列 。 

(2) 散 列 表 的 冲突 现象 

Q@ 冲突 

两 个 不 同 的 关键 字 ， 由 于 散 列 函数 值 相 同 ， 因 而 被 映射 到 同一 表 位 置 上 。 该 现象 称 为 
冲突 (Collision) 或 碰撞 。 发 生 冲 突 的 两 个 关键 字 称 为 该 散 列 函数 的 后 同义词 (Synonym)。 

安全 避免 冲突 的 条 件 

最 理想 的 解决 冲突 的 方法 是 安全 避免 冲突 。 要 做 到 这 一 点 必须 满足 两 个 条 件 : 其 一 是 
idm; 其 二 是 选择 合适 的 散 列 函数 。 | 

这 只 适用 于 |UI 较 小 ， 且 关键 字 均 事先 已 知 的 情况 ， 此 时 经 过 精心 设计 散 列 函数 及 有 可 
能 完全 避免 冲突 。 

@ 冲突 不 可 能 完全 避免 

通常 情况 下 ，h 是 一 个 压缩 映像 。 虽 然 | 风 <m， 但 |Ul>m， 故 无 论 怎样 设计 h， 也 不 可 
能 完全 避免 冲突 。 因 此 ， 只 能 在 设计 有 时 尽 可 能 使 冲突 最 少 。 同 时 还 需要 确定 解决 冲突 的 
方法 ， 使 发 生 剖 突 的 同义词 能 够 存储 到 表 中 。 

由 影响 冲突 的 因素 

冲突 的 频 党 程度 除了 与 疡 相关 外 ， 还 与 表 的 填 满 程度 相关 。 

设 m 和 nn 分别 表示 表 长 和 表 中 填 入 的 结 点 数 ， 则 将 a=n/m 定义 为 散 列 表 的 装填 因子 
(Load Factor)。a 越 大 ， 表 越 满 ， 冲突 的 机 会 也 越 大 。 通常 取 a<1。 
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2. 散 列 函数 的 构造 


(1) 基本 思想 

亦 列 函数 的 基本 思想 是 : 在 记录 的 存储 位 置 和 关键 字 之 间 确 定 一 种 对 应 关系 f， 使 每 
一 个 关键 字 和 结构 中 的 一 个 存储 位 置 相 对 应 ， 由 此 只 要 知道 关键 字 玉 ， 就 可 以 知道 关键 字 
的 记录 所 存放 的 位 置 RK)， 从 而 取得 记录 。 

使 用 散 列 表 ， 首 先 必 须 确 定 一 个 好 的 HASH 函数 ， 使 关键 字 上 映像 地 址 集合 中 任意 地 址 
的 概率 相同 ， 即 所 得 地 址 区 间 在 整个 地 址 区 间 中 是 随机 的 ， 称 散 列 函数 是 均匀 的 。 但 是 散 
列 函数 无 论 怎样 ， 处 理 大 量 的 数据 时 ， 仍 然 避 免不了 地 址 冲突 (碰撞 ) 的 情况 ， 所 以 建立 比 
较 好 的 HASH 函数 尤为 重要 。 

建立 HASH 的 方法 有 多 种 , 但 要 注意 的 是 HASH 函数 只 对 数值 型 的 查找 码 转换 ， 若 为 
非 数 值 型 ， 需 要 用 某 种 方法 将 它 转换 为 数值 型 ， 再 转换 为 地 址 。 

QD 除 余 法 

取 关 键 字 被 某 一 个 不 大 于 散 列 表 表 长 m 的 质数 p 除 后 所 得 的 余数 为 散 列 地 址 。 


H(key)= key mod p (pm) 


其 中 jp 一般 选择 不 大 于 20 的 质数 。 质数 除 余 法 是 常用 的 构造 HASH 函数 的 方法 之 一 。 

® 平方 取 中 法 

计算 key 的 平方 ， 再 取 结 果 的 中 间 部 分 值 作为 HASH 地 址 。 

@) 相 乘 取 整 法 | 

该 方法 包括 两 个 步骤 :首先 用 关键 字 key 乘 以 某 个 常数 4(0<4<1)， 并 抽取 key.4 的 小 
数 部 分 ， 然 后 用 m 乘 以 该 小 数 后 取 整 。 

由 随机 数 法 


h(k)=random(key) 


选取 一 个 随机 函数 ， 取 关键 字 的 随机 函数 的 值 为 散 列 地 址 。 

(2) 碰撞 (冲突 ) 的 处 理 法 

通常 来 说 ， 处 理 碰撞 的 方法 有 3 种 ， 开 放 地 址 法 、 拉 链 法 和 差 值 法 。 

开放 地 址 法 是 将 所 有 结 点 均 存 储 在 散 列 表 710…m - 1] 中 ; 拉链 法 是 将 互 为 同义词 的 结 
点 链 成 一 个 单 链表 ， 只 将 链表 的 头 指针 存放 在 散 列 表 TT0…m - 1] 数 组 中 。 

Q@ 开放 地 址 法 

当 冲 突 发 生 时 ， 使 用 某 种 探查 (探测 ) 技 术 在 散 列 表 中 形成 一 个 探查 ( 测 ) 序 列 ， 沿 此 序列 
逐个 单元 地 查找 , 直到 找到 给 定 的 关键 字 或 者 碰 到 一 个 开放 的 地 址 ( 即 该 地 址 单元 为 空 ) 为 止 。 


Hi=(H(key}+tdi) mod m i=]， 2， "ys k(K<m - 1) 


其 中 : H(key) 为 HASH 函数 ，m 为 散 列表 长 ，4di 为 增 量 序列 ， 可 有 下 列 三 种 取 法 。 
e di=1]，2，3，…，m -1， 称 为 线性 探测 再 散 列 
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基本 思想 :将 散 列表 710…m - 1] 看 成 一 个 循环 向 量 ， 车 初始 探查 的 地 址 为 d( 即 
h(key)=d)， 则 最 长 的 探 查 序列 为 : 


0 d+!l, d+2, "sy m-1, 0， ] ， …, d-1 


即 依 次 从 TId 开 始 探 查 ， 直 到 探查 到 TT4 - 1] 为 止 。 

探查 过 程 终止 于 3 种 情况 : 者 当前 探查 的 单元 为 空 ， 表 示 查 找 失 败 ,， 若是 播 入 则 将 key 
写 和 其中; 看 当前 探查 的 单元 中 含有 key， 则 查找 成 功 ， 但 对 于 插入 意味 失败 ， 若 探查 到 
TId - 1] 时 仍 未 发 现 空 单元 ， 也 未 找到 key， 则 是 查找 插入 失败 (因此 时 表 满 )。 

线性 探查 法 的 探查 序列 表达 式 为 : 


hi=(h(key)+i) % m 0<i<m-1 
此 时 di=i。 
e di=12，- 12，22，- 22，…， 土 已 化 委 m/2)， 称 为 二 次 探测 再 散 现 
该 方法 的 探查 序列 是 : 
hi=(h(key)+i”) %m 0<i<m-!1 
此 时 di= 产 。 
该 方法 的 缺 反 是 不 易 探查 到 整个 散 列 空间 。 
e 双重 散 列 法 


该 方法 是 开放 地 址 法 中 的 最 好 方法 之 一 ， 它 的 探查 序列 为 : 
ji=(Hkey)Hi*y hlkey hom 0<i<m-1 


此 时 di=i * hl(key)。 
探 朋 序 列 为 :d=h(key), (d+hl(key))%m, (d+2hl(key))%m 等 。 该 方法 使 用 了 h(key) 和 hl(key) 
两 个 散 列 函 数 ， 所 以 称 为 双重 散 列 法 。 
定义 hl(key) 的 方法 较 多 , 但 是 无 论 采用 什么 方法 定义 , 都 必须 使 h(key) 的 值 和 m 互 素 ， 
才能 使 发 生 冲 突 的 同义词 地 址 均匀 地 分 布 在 整个 表 中 ， 否 则 可 能 造成 同义词 地 址 的 循环 
计算 。 : / 
厂 m 为 素数 ， 则 hl(key)=key%(m - 2)+1。 
@ 拉链 法 
拉链 法 解决 冲突 的 作法 是 ， 将 所 有 关键 字 为 同义词 的 结 点 链接 在 同一 个 单 链表 中 ，。 
右 选 定 的 散 列 表 长 度 为 m, 则 可 将 散 列 表 定义 为 m 个 链表 , 所 有 链表 头 存放 在 数组 7TT0… 
m - 1] 中 ， 凡 是 散 列 地 址 为 i 的 结 点 ， 均 插入 到 以 TT 为 头 指针 的 单 链表 中 。T 中 各 分 量 
的 初 值 均 应 为 空 。 | 
用 拉链 法 处 理 碰撞 时 ， 散 列表 的 每 一 个 结 点 增加 一 个 链接 结 点 字段 ， 用 来 连接 同义词 
字 表 。 
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与 开放 地 址 法 相 比 ， 拉 链 法 有 如 下 几 个 优 后 : 
e 拉链 法 处 理 冲突 简单 ， 且 无 堆积 现象 ， 即 非 同 义 词 决 不 会 发 生 冲 突 ， 因 此 平均 查找 


长 度 较 短 。 
e 由 于 拉链 法 中 各 链表 上 的 结 扩 空间 是 动态 申请 的 , 故 它 更 适合 于 造 表 前 无 法 确定 表 
长 的 情况 。 


。 开放 地 址 法 为 减少 冲突 要 求 装填 因子 a 较 小 ， 故 当 结 点 规模 较 大 时 会 浪费 很 多 空 
间 ， 而 拉链 法 中 可 取 a 之 1， 且 结 点 较 大 时 ， 拉 链 法 中 增加 的 指针 域 可 忽略 不 计 ， 
因此 节省 空间 。 

。 在 用 拉链 法 构造 的 散 列表 中 ,删除 结 点 的 操作 易于 实现 。 只 要 简单 地 删 去 链表 上 相 

应 的 结 点 即 可 。 而 对 开放 地 址 法 构造 的 散 列 表 ， 删 除 结 点 不 能 简单 地 将 被 删 结 点 的 
空间 置 为 空 ， 否则 将 截断 在 它 之 后 填 入 散 列表 的 同义词 结 点 的 查找 路 径 , 这 是 因为 
各 种 开放 地 址 法 中 ， 空 地 址 单元 ( 即 开 放 地 址 ) 都 是 查找 失败 的 条 件 。 因 此 在 用 开放 
地 址 法 处 理 冲突 的 散 列表 上 执行 删除 操作 时 ， 只 能 在 被 删 结 点 上 做 删除 标记 ， 而 不 
能 真正 删除 结 点 。 

拉链 法 的 缺点 是 ， 指 针 需 要 额外 的 空间 ， 故 当 结 点 规模 较 小 时 ， 开 放 地 址 法 较为 节省 
空间 ， 而 若 将 节省 的 指针 空间 用 来 扩大 散 列 表 的 规模 ， 可 使 装填 因子 变 小 ， 这 又 减少 了 开 
放 地 址 法 中 的 冲突 ， 从 而 提高 平均 查找 速度 。 

@ 差 值 法 

差 值 法 所 采用 的 就 是 当 散 列 函 数 产生 的 数据 地 址 已 有 数据 存在 时 ， 发 生 散 列 碰撞 。 处 
理 的 原则 以 现在 的 数据 地 址 加 上 一 个 固定 的 差 值 ， 当 数据 地 址 超出 数组 大 小 时 ， 让 数据 地 
址 采用 循环 的 方式 处 理 ， 即 新 数据 地 址 对 数组 大 小 取 余数 。 


3. 散 列 表 的 算法 


散 列 表 上 的 运算 有 查找 、 插 入 和 删除 。 其 中 主要 是 查找 ， 这 是 因为 散 列 表 主 要 用 于 快 
速 合 找 ， 且 插入 和 删除 均 要 用 到 查找 操作 。 下 面 就 是 运用 余数 法 作为 散 列 函数 及 差 值 法 解 
决 敬 列 碰撞 问题 的 查找 算法 。 


/天 一 一 一 一 一 Program Discription 
/程序 名 称 : hsearch.java 
// 程 序 目的 : 运用 余数 法 作为 散 列 函数 及 差 值 法 解决 散 列 碰撞 问题 。 
/i 
Import java.util.*; 
Import java.10.*; 
public class hsearch 
{ public static int Max=6; 1/ 数据 最 大 个 数 
public static int Hash Max=5; // 散 列表 最 大 个 数 
public static int[] HashTab=new int[HashMax]; /和 散 列 表 数 组 
pubjic static int{] Data= z 
{ 12,160,219,522,9997}; // 数 据 数 组 


数据 结构 与 算法 分 析 (Java 版) 


public static int Counter=1; /1 计数 疾 


public static vold main(String args[]) 
{ int KeyValue:; // 欲 查找 值 
int Index， // 输 入 数组 下 标 
int i: /循环 变量 
Index=0; /初始 数组 下 标 
System.out.print("Input Data:"); /和 输出 输入 数据 


for (1=0;1<Max ;I++ ) 
System.out.print("["+Datali]l+"|]"); 
System.out.println(”); 


for (i=0;i<HashMax :i++ ) // 散 列表 初始 化 
HashTab[i]=0; 
while (Index<Max) /建立 散 列 表 


{ if (CreateHash(Data[Index])) 
System.out.println("Hash Success!!"): // 建 立成 功 


else 
System.out.println("Hash Fulled!!1"); /建立 失败 
Index+t+; 
} 
for (i=0;i<HashMax ;i++ ) // 输 出 散 列 表 数 据 


System.out.print("["+HashTab{i]+"]"); 
System.out.println("™"); 
ConsoleReader console=new ConsoleReader(System.in); 
while (true) ”W 利 用 散 列 表 查 找 数据 z 
{system.out.print("Please enter your key value(0 for Exit):"); 
InputstreamReader is=new InputStreamReader(System.in); 
BufferedReader br=new BufferedReader(is); 
StringTokenizer st; 
try{ String myline=br. readLine(); 
st=new StringTokenizer(myline); 


KeyValue=Integer.parseInt(st.nextToken());// 取 得 输入 值 
} 
catch({IOFException loe) 
{ System.out.print("IO error:"+ioe); 
} 
if (KeyValue==0) / 行 输入 0 则 结束 程序 
break; 
if (HashSearch(KeyValue)) /输出 查找 次 数 
System.out.printin("Search Time="+ Counter); 
else // 输 出 没有 找到 数据 


System.out.println("No Found!!"); 
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//--------------------------------------------------------- 
// 散 列 函 数 中 的 余数 法 
//----------------------------------------------------~--~- 
public static Int Hash Mod(int KeyValue) 
{ return KeyValue % HashMax; /返回 的 键 值 除 以 散 列 表 大 小 取 余 数 
} 四 
//~-------------------------------------------------------- 
// 莽 值 法 
f= 


public static int CollisionOffset(int Address) 
{ ”int Offset=3; 。”/W 设 差 值 为 3 
return (Address+Offset) % HashMax; /返回 旧地 址 加 差 值 除 以 散 列 表 大 小 取 余 数 


/建立 散 列表 加 
//--------------------~------------------------------------ 
public static boolean CreateHash(int KeyValue) 


int HashTime; 。 ”// 散 列 次 数 
int CollisionTime; /碰撞 次 数 
int Address; ”// 数 据 地 址 
int i: // 衢 环 变量 
HashTime=0; /初始 散 列 次 数 
CollisionTime=0; /初始 碰撞 次 数 
Address=HashMod(KeyVaiue); /调用 散 列 函数 
while (HashTime<=HashMax) ”“”// 散 列 次 数 超过 散 列表 容量 
{ if (HashTab[Address|=—0) 
{ HashTIabfAddress]=KeyValue; /可 存储 数据 
System.out.print("Key:"+KeyValue);  // 输 出 位 置 
System.out.printin("=>Address"+Address)， 
for (1=0;1<HashMax ;i++ ) 1 输出 散 列表 内 容 
{ System.out.print("["+HashTab[i]+"]"): 
} 
System.out.println(""); 
return true.; 
} 
else /不 可 存储 数据 
{ CollisionTime++; /累计 碰撞 次 数 
System.out.print("Collision"+CollisionTime): 
System.out.printljn("=>Address"+Address); 
Address=CollisionOffset(Address); /调用 差 值 法 
HashTime+t+: / 暴 计 散 列 次 数 
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return false: 


//--------------------------------~-~-~------------------------ 

// 散 列 查找 法 

//----------------~--------~------------------------~--------- 
public static boolean HashSearch(int KeyValue) 


{ int Address; // 数 据 地 址 
Counter=0; 
Address=Hash Mod(KeyValue); // 调 用 散 列 函数 


while (Counter<“Hash Max) 
{ Countert+; 
if (HashTab[Addressl==KeyValue) // 找 到 数据 
return true; 
else /未 找到 数据 
Address=CollisionOffset(Address); /调用 差 值 法 
return false: 


月 


4. 性 能 分 析 


由 于 插入 和 删除 的 时 间 均 取决 于 查找 ， 下 面 只 分 析 查 找 操 作 的 时 间 性 能 。 

虽然 散 列 表 在 关键 字 和 存储 位 置 之 间 建立 了 对 应 关系 ， 理 想 情 况 是 无 须 关键 字 的 比较 
就 可 找到 待 查 关键 字 。 但 是 由 于 冲突 的 存在 ， 散 列表 的 查找 过 程 仍 是 一 个 和 关键 字 比较 的 
过 程 ， 不 过 散 列表 的 平均 查找 长 度 比 顺序 查找 、 二 分 查找 等 完全 依赖 于 关键 字 比较 的 查找 
要 小 得 多 。 
一 般 情况 下 ， 处 理 冲 突 (碰撞 ) 方 法 相同 的 散 列表 ， 其 平均 查找 长 度 依赖 于 散 列表 的 装 
填 因 子 。 


向 列表 的 装填 因子 的 定义 为 : 
a = 表 中 填 入 的 记录 数 / 散 列表 的 长 度 


a 标 坊 散 列表 的 装 满 程 度 。 直 观 地 讲 ， 其 值 越 小 ， 发 生 冲 突 的 可 能 性 就 越 小 ， 否 则 ， 


上 发生 神 突 的 可 能 性 就 越 大 。 

(1) 查找 成 功 的 ASL 

艇 列表 上 的 查找 优 于 顺序 查找 和 二 分 查找 。 
线性 探查 法 查找 成 功 的 平均 查找 长 度 为 : 


ASLXS[1+1 / (1 - o)] /2 
拉链 法 查找 成 功 的 平均 查找 长 度 为 ; 


ASL~1+o/2 
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(2) 查找 不 成 功 的 ASL 

对 于 不 成 功 的 查找 ， 顺 序 查找 和 二 分 查找 所 需 进行 的 关键 字 比较 次 数 仅 取决 于 表 长 ， 
而 散 列 查找 所 需 进行 的 关键 字 比较 次 数 和 待 查 结 点 有 关 。 因 此 ， 在 等 概率 情况 下 ， 也 可 将 
散 列表 在 查找 不 成 功 时 的 平均 查找 长 度 定义 为 查找 不 成 功 时 对 关键 字 需 要 执行 的 平均 比较 
次 数 。 

项 注意 的 是 : 

@ 由 同一 个 散 列 函数 、 不 同 的 解决 冲突 方法 构造 的 散 列 表 ， 其 平均 查找 长 度 是 不 相 
同 的 。 

@@ 散 列表 的 平均 查找 长 度 不 是 结 点 个 数 n 的 函数 ， 而 是 装填 因子 a 的 函数 。 因 此 在 
设计 散 列表 时 可 选择 a 以 控制 散 列表 的 平均 查找 长 度 。 

@ a 的 取 值 。a 越 小 ， 产 生 冲 突 的 机 会 就 小 ， 但 a 过 小 ， 空 间 的 浪费 就 过 多 。 只 要 a 
选择 合适 ， 散 列表 上 的 平均 查找 长 度 就 是 一 个 常数 ， 即 散 列表 上 查找 的 平均 时 间 为 O(1)。 

@ 散 列 法 与 其 他 查找 方法 的 区 别 。 除 散 列 法 外 ， 其 他 查找 方法 的 共同 特征 为 ， 均 是 
建立 在 比较 关键 字 的 基础 上 。 其 中 顺序 查找 是 对 无 序 集合 的 查找 ， 每 次 关键 字 的 比较 结果 
为 “=” 或 “!=” 两 种 可 能 ， 其 平均 时 间 为 O(n)， 其 余 的 查找 均 是 对 有 序 集合 的 查找 ， 每 
次 关键 字 的 比较 有 “=”、“<” 和 “>”3 种 可 能 ， 且 每 次 比较 后 均 能 缩小 下 次 的 查找 范围 ， 
故 查 找 速度 更 快 ， 其 平均 时 间 为 Ollgn)。 而 散 列 法 是 根据 关键 字 直 接 求 出 地 址 的 查找 方法 ， 
其 查找 的 期 望 时 间 为 O(1)。 


思考 和 练习 


3,15,36,57,66,88,99,100,123,134,256 
试用 顺序 查找 法 查找 88 和 300， 写 出 运作 过 程 。 
8,15,38,57,68,88,98,108,129,234,256 
试用 二 分 查找 法 查找 88 和 222， 写 出 运作 过 程 。 
(3) 有 一 组 数据 ， 内 容 如 下 : 
8,15,6,57,99,88,98,18,12,234,256 
试 建立 其 二 又 排序 数 ， 并 列表 算出 各 数据 的 查找 次 数 。 
(4) 试 运用 平方 取 中 法 作为 散 列 函数 及 拉链 法 来 设计 散 列 表 。 
(5) 实现 一 个 类 ， 其 功能 是 统计 一 个 文本 文件 中 单词 的 频率 ， 输 出 这 些 单词 及 其 频率 
的 列表 。 
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数据 结构 包括 了 存储 结构 和 逻辑 结构 ， 只 有 在 确定 了 存储 结构 的 情况 下 ， 可 以 实现 具 
体 算法 。 但 是 在 数据 结构 中 只 是 借助 高 级 语言 加 以 描述 ， 并 没有 涉及 具体 的 存储 分 配 。 本 
章 主要 讨论 存储 空间 的 分 配 和 管理 方法 。 

本 章 的 学 习 目 标 : 

e 动态 存储 管理 的 分 配方 法 ; 

e 存储 空间 的 回收 方法 ; 

e 存储 崇 缩 。 
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在 介绍 的 3 种 数据 


Hi 








线性 结构 、 层 次 结构 和 网 状 结构 中 ， 使 用 高 级 语言 描述 了 
它们 的 内 存 映 像 但 并 没有 涉及 具体 的 存储 分 配 。 实 际 上 结构 中 的 每 个 数据 元 素 都 占有 一 定 
的 内 存 位 置 ， 在 程序 的 执行 过 程 中 ， 数 据 元 素 的 存 取 是 通过 对 应 的 存储 单元 来 进行 的 。 

在 早期 的 计算 机 上 , 这 个 存储 管理 的 工作 是 由 程序 员 自 己 来 完成 的 。 在 程序 执行 之 前 ， 
首先 需 将 用 机 器 语言 或 汇编 语言 编写 的 程序 输送 到 内 存 的 某 个 固定 区 域 上 ， 并 预先 给 变量 
和 数据 分 配 好 对 应 的 内 存 地 址 (绝对 地 址 或 相对 地 址 )。 有 了 高 级 语言 之 后 ， 程 序 员 不 需要 
直接 和 内 存 地 址 打交道 ， 程 序 中 使 用 的 存储 单元 都 由 逻辑 变量 (标识 符 ) 来 表示 ， 它 们 对 应 
的 内 存 地 址 都 是 由 编译 程序 在 编译 或 执行 时 进行 分 配 。 

另 一 方面 , 当 计 算 机 是 被 单个 用 户 使 用 时 , 整个 内 存 除 操 作 系 统 占 用 一 部 分 之 。 外 ， 
都 归 这 个 用 户 的 程序 使 用 (如 PDP-11/01 的 内 存 为 32KB， 系 统 占用 4KB， 用 户 程序 可 用 
28KB)。 但 在 多 用 户 分 时 并 发 系统 中 ， 多 个 用 户 程 序 共 享 一 个 内 存 区 域 ， 此 时 每 个 用 户 
程序 使 用 的 内 存 就 由 操作 系统 来 进行 分 配 了 。 并 且 ， 在 总 的 内 存 不 够 使 用 时 ， 还 可 采用 自 
动 覆 盖 技 术 。 

对 操作 系统 和 编译 程序 来 说 ， 存 储 管理 都 是 一 个 复杂 而 又 重要 的 问题 。 不 同 语言 的 编 
译 程序 和 不 同 的 操作 系统 可 以 采用 不 同 的 存储 管理 方法 。 它 们 采用 的 具体 做 法 ， 读 者 将 在 
操作 系统 中 学 习 。 本 课程 仅 就 动态 存储 管理 中 涉及 的 一 些 基 本 技术 进行 讨论 。 

动态 存储 管理 的 基本 问题 是 系统 如 何 应 用 户 提 出 的 “请 求 ”分 配 内 存 ? 又 如 何 回收 那 
些 用 户 不 再 使 用 而 “释放 ”的 内 存 ， 以 备 新 的 “请 求 ” 产 生 时 重新 进行 分 配 ? 提出 请 求 的 
用 户 可 能 是 进入 系统 的 一 个 作业 ， 也 可 能 是 程序 执行 过 程 中 的 一 个 动态 变量 。 因 此 ， 在 不 
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同 的 动态 存储 管理 系统 中 ， 请 求 分 配 的 内 存量 大 小 不 同 。 通 常 在 编译 程序 中 是 一 个 或 几 个 
字 ， 而 在 系统 中 则 是 几 千 、 几 万 ， 甚 至 是 几 十 万 字 。 然 而 ， 系 统 每 次 分 配给 用 户 (不 论 大 小 ) 
的 都 是 一 个 地 址 连续 的 内 存 区 。 为 了 叙述 方便 ， 在 下 面 的 讨论 中 ， 将 统称 已 分 配给 用 户 使 
用 的 地 址 连续 的 内 存 区 为 “占用 块 ”， 称 未 曾 分 配 的 地 址 连续 的 内 存 区 为 “可 利用 空间 块 
或 “空闲 块 ”。 

显然 ,不 管 什么 样 的 动态 存储 管理 系统 ， 在 刚 开始 时 ， 整 个 内 存 区 是 一 个 “ 空 闪 块 ”。 
随 着 用 户 进入 系统 ， 并 先后 提出 存储 程序 或 数据 的 请 求 ， 系 统 则 依次 进行 分 配 。 因 此 ， 在 
系统 运行 的 初期 ， 整 个 内 存 区 基本 上 分 隔 成 两 大 部 分 ， 低 地 址 区 包含 若干 已 经 被 程序 或 数 
据 使 用 的 占用 块 ; 高 地 址 区 ( 即 分 配 后 的 剩余 部 分 ) 是 内 存 中 没有 被 分 配 程序 和 数据 的 部 分 ， 
是 一 个 “空闲 块 ”。 

例如 图 9-1 所 示 为 依次 给 8 个 用 户 进行 分 配 后 的 系统 的 内 存 状态 .经 过 一 段 时 间 以 后 ， 
有 的 用 户 运行 结束 ， 它 所 占用 的 内 存 区 变 成 空闲 块 ， 这 就 使 整个 内 存 区 呈现 出 占用 块 和 空 
闲 块 交错 的 状态 ， 如 图 9-2 所 示 。 





和 9-1 动态 存储 分 配 过 程 中 Te 


ul TelwrTw ra T 


图 9-2“ 系统 运行 若干 时 间 后 的 内 存 分 配 图 


在 计算 机 运行 长 时 间 后 , 可 能 出 现 一 个 新 的 用 户 ， 申请 的 空间 大 小 超过 U1 和 U3 之 间 
的 空间 大 小 ， 此 时 可 能 所 有 的 小 块 的 空间 都 不 能 满足 新 用 户 的 要 求 ， 但 是 所 有 的 小 空间 的 
总 和 却 大 于 新 用 户 所 需要 的 空间 ， 这 就 造成 新 用 户 不 能 得 到 内 存 分 配 的 空间 而 无 法 运行 ， 
使 新 用 户 处 于 等 待 状态 。 解 决 方案 相对 容易 ， 如 将 所 有 的 数据 移动 ， 使 所 有 的 小 空闲 块 连 
接 成 一 个 大 空间 块 ， 然 后 分 配给 新 的 用 户 ， 但 是 此 时 ， 可 能 需要 大 量 的 数据 移动 ， 这 就 占 
用 了 大 量 的 CPU 时 间 ， 造 成 系统 的 效率 降低 。 


9.2 内 存 分 配 与 回收 策略 


程序 的 执行 离 不 开 内 存 , 因为 CPU 不 能 和 外 存 进行 数据 交换 ， 它 只 能 和 内 存 进 行 数据 
交换 ， 所 以 内 存 的 分 配 与 回收 是 内 存 管理 的 主要 功能 之 一 。 无 论 采用 哪 一 种 管理 和 控制 方 
式 , 能 否 把 外 存 中 的 数据 和 程序 调 入 内 存 , 取决 于 能 否 在 内 存 中 为 它们 安排 合适 的 位 置 (内 
存 空间 够 用 )。 因 此 ， 存 储 管理 模块 要 为 每 一 个 同时 执行 的 程序 分 配 内 存 空间 。 另 外 ， 当 程 
序 执行 结束 之 后 ， 存储 管理 模块 又 要 及 时 回收 该 程序 所 占用 的 内 存 资源 ， 以 便 将 空间 分 配 
给 其 他 程序 。 

为 了 有 效 合理 地 利用 内 存 ， 设计 内 存 的 分 配 和 回收 方法 时 ， 必须 考虑 和 确定 以 下 几 种 
策略 和 数据 结构 。 / 
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(1) 分 配 结构 ， 需 要 登记 内 存 使 用 情况 ， 供 分 配 程 序 使 用 的 表格 与 链表 。 例 如 内 存 空 
闲 区 表 、 空 闲 区 队列 等 。 分 配 结 构 直接 影响 到 胡 找 可 用 空 用 块 的 时 间 ， 同时 也 影响 到 内 和 存 
的 回收 效率 。 

(2) 放置 策略 : 确定 调 入 内 存 的 程序 和 数据 在 内 存 中 的 位 置 。 这 是 一 种 选择 内 存 空 用 
区 的 策略 。 该 策略 的 好 与 坏 可 以 直接 影响 内 存 的 使 用 效率 和 内 存 分 配 时 查找 可 用 空 用 块 的 
时 间 。 

(3) 交换 策略 : 在 需要 将 某 个 程序 段 和 数据 调 入 内 存 时 ， 如 果 内 存 中 没有 足够 的 空闲 
区 ， 由 交换 策略 来 确定 把 内 存 中 的 哪些 程序 段 和 数据 段 调 出 内 存 ， 以 便 腾 出 足够 的 空间 。 
该 调度 方法 可 以 提高 内 存 的 使 用 效率 。 

(4) 调 入 策略 : 外 存 中 的 程序 段 和 数据 段 什么 时 间 按 什么 样 的 控制 方式 进入 内 存 。 调 
入 策略 与 内 外 和 存 数 据 流动 控制 方式 有 关 。 

(5) 回收 策略 : 回收 策略 包括 2 点 ， 一 是 回收 的 时 机 ， 二 是 对 所 回收 的 内 存 空闲 区 和 
已 存在 的 内 和 存 空 用 区 的 调整 。 / 

实际 上 ， 对 内 和 存 的 管理 或 对 内 存 的 分 配 策略 通常 有 两 种 方法 : 

(1) 系统 从 高 地 址 的 空闲 块 中 进行 分 配 空间 ， 直 到 分 配 无 法 进行 时 ， 系 统 才 去 回收 所 
有 用 成 不 再 使 用 的 空 用 块 ， 重 新 组 织 内 存 ， 并 将 所 有 的 空闲 块 连接 起 来 使 之 形成 一 个 大 的 
空闲 块 ， 又 可 以 继续 分 配 空间 。 

(2) 用 户 一 旦 运行 结束 ， 立 即将 他 所 占用 的 内 存 释 放 ， 使 之 变 成 空闲 块 ， 当 新 的 用 户 
申请 空间 时 ， 搜 寻 所 有 的 空闲 块 ， 找 到 最 合适 的 空闲 块 分 配给 他 。 此 时 需要 建立 一 个 空闲 
顽 的 链表 或 目录 表 ， 也 称 为 “可 利用 空闲 表 ”， 由 该 表 统 一 管理 所 有 的 空闲 空间 。 在 目录 
表 中 ， 每 个 表 目 应 该 包含 的 信息 有 初始 地 址 、 空 闲 块 大 小 和 使 用 情况 : 在 链表 中 ， 每 个 结 
点 表示 一 个 空闲 块 ， 系 统 每 次 分 配 或 回收 一 块 空间 相当 于 在 空闲 链表 中 删除 或 插入 一 个 空 
采 结 所 。 

选用 何 种 方法 ， 一 般 由 操作 系统 确定 。 在 数据 结构 中 ， 一 般 选 择 第 2 种 分 配方 案 讨论 
内 存 管理 


9.3 ”可 利用 空间 的 分 配方 法 


目录 表 的 情况 将 在 操作 系统 课程 中 详细 介绍 ， 在 此 仅 就 链表 的 情况 进行 讨论 。 链 表情 
况 是 指 内 存 的 空闲 块 ， 通 过 单 向 链表 或 双向 链表 连接 起 来 。 

如 上 所 述 ， 可 利用 空间 表 中 包含 所 有 可 分 配 的 空闲 块 ， 每 一 块 是 链表 中 的 一 个 结 点 。 
当 用 户 请 求 分 配 时 ， 系 统 从 可 利用 空闲 表 中 删除 一 个 结 点 分 配 之 ， 当 用 户 释放 其 所 占 内 存 
时 ， 系 统 即 回收 并 将 它 插入 到 可 利用 空闲 表 中 。 因 此 ， 可 利用 空闲 表 亦 称 作 “存储 池 ”。 
根据 系统 运行 的 不 同情 况 ， 可 利用 空闲 表 可 以 有 下 列 3 种 不 同 的 结构 形式 。 

第 1 种 情况 ， 系 统 运行 期 间 所 有 用 户 请 求 分 配 的 存储 量 大 小 相同 。 对 此 类 系统 ， 通 党 
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的 做 法 是 ， 在 系统 开始 运行 时 将 归 它 使 用 的 内 存 区 按 所 需 大 小 分 割 成 者 干 大 小 相同 的 块 ， 
然后 用 指针 链接 成 一 个 可 利用 空间 表 。 由 于 表 中 结 点 大 小 相同 ， 则 分 配 时 无 需 查找 ， 只 要 
将 第 一 个 结 扣 分 配给 用 户 即 可 ; 同样 ， 当 用 户 释 放 内 存 时 ， 系 统 只 要 将 用 户 释 放 的 空 闪 块 
插入 在 表 头 即 可 。 可 见 ， 这 种 情况 下 的 可 利用 空闲 表 实 质 上 是 一 个 链 栈 。 这 是 一 种 最 简单 
的 动态 存储 管理 的 方式 。 但 是 此 种 情况 在 分 配 空间 时 ， 有 可 能 浪费 比较 多 的 存储 空间 ， 使 
空间 的 利用 率 大 大 降低 。 例 如 ， 一 段 程 序 可 能 需要 的 空间 非常 小 ， 它 也 需要 从 链表 中 删除 
一 个 结 点 ， 此 时 结 点 空间 浪费 比较 大 。 同 时 此 种 分 配方 案 对 于 多 道 程序 的 执行 不 能 够 根据 
需要 分 配 ， 而 只 能 无 论 大 小 程序 或 数据 都 分 配 相 同 大 小 的 空间 ， 对 于 较 大 的 程序 可 能 会 造 
成 无 法 分 配 空间 ， 导 致 程序 无 法 运行 。 

第 2 种 情况 , 系统 运行 期 间 用 户 请 求 分 配 的 存储 量 有 若干 种 大 小 的 规格 。 对 此 类 系统 ， 
一 般 情况 下 是 建立 圭 干 个 可 利用 空间 表 ， 同 一 链表 中 的 结 点 大 小 相同 。 例 如 ， 某 动态 存储 
管理 系统 中 的 用 户 将 请 求 分 配 2 个 字 、4 个 字 或 8 个 字 的 内 存 块 ， 则 系统 建立 三 个 结 点 大 
小 分 别 为 3 个 字 、5 个 字 和 9 个 字 的 链表 ， 它 们 的 表 头 指针 分 别 为 av2、av4 和 av8。 每 个 
结 点 中 的 第 一 个 字 设 有 链 域 dink)、 标 志 域 (tag) 和 结 点 类 型 域 (type)。 结 点 结构 如 图 9-3 所 示 ， 
其 中 ， 类 型 域 为 区 别 3 种 大 小 不 同 的 结 点 而 设 ，type 的 值 为 0、1 或 2， 分 别 表 示 结 点 大 小 
为 2 个 字 、4 个 字 或 8 个 字 ; 标志 域 tag 为 0 或 1 分 别 表示 结 点 为 空闲 块 或 占用 块 ; 链 域 中 
存储 指向 同一 链表 中 下 一 结 点 的 指针 , 而 结 点 中 的 值 域 是 其 大 小 分 别 为 2、4 和 8 个 字 的 连 
续 空间 。 此 时 的 分 配 和 回收 的 方法 在 很 大 程度 上 和 第 1 种 情况 类 似 ， 只 是 当 结 点 大 小 和 请 
求 分 配 的 量 相 同 的 链表 为 空 时 ， 需 查询 结 点 较 大 的 链表 ， 并 从 中 取出 一 个 结 点 ， 将 其 中 一 
部 分 内 存 分 配给 用 户 ， 而 将 剩余 部 分 插入 到 相应 大 小 的 链表 中 。 回 收 时 ， 也 只 要 将 释放 的 
空闲 块 插入 到 相应 大 小 的 链表 的 表 头 中 去 即 可 。 然 而 ， 这 种 情况 的 系统 还 有 一 个 特殊 的 问 
题 要 处 理 ， 即 当 结 点 与 请 求 相符 的 链表 和 和 结 点 更 大 的 链表 均 为 空 时 ， 分 配 不 能 进行 ， 而 实 
际 上 内 存 空间 并 不 一 定 不 存在 所 需 大 小 的 连续 空间 ， 只 是 由 于 在 系统 运行 过 程 中 ， 频 繁 出 
现 小 块 的 分 配 和 回收 ,使 得 大 结 点 链表 中 的 空闲 块 被 分 隔 成 小 块 后 播 入 在 小 结 点 的 链表 中 ， 
此 时 者 要 使 系统 能 继续 运行 ， 就 必须 重新 组 织 内 存 ， 即 执行 “存储 紧缩 ”的 操作 。 

tag type link 


value 


图 9-3 空闲 块 结构 


0 空闲 块 
tag = 


] 占用 块 


1 结 点 大 小 为 4 个 字 


0 结 皮 大 小 为 2 个 字 
type = 
2 结 点 大 小 为 8 个 字 
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第 3 种 情况 ， 系 统 在 运行 期 间 分 配给 用 户 的 内 存 块 的 大 小 不 固定 ， 可 以 随 请 求 而 变 。 
因此 ， 可 利用 空间 表 中 的 结 点 邑 空闲 块 的 大 小 也 是 随意 的 。 通 常 ， 操 作 系 统 中 的 可 利用 空 
间 表 属于 这 种 类 型 。 . | / 

系统 刚 开始 工作 时 ， 整个 内 存 空 间 是 一 个 空 亲 块 即 可 利用 空间 表 中 只 有 一 个 大 小 为 
整个 内 存 区 的 结 点 ， 可 利用 空间 表 的 大 小 和 个 数 随 着 分 配 和 回收 的 不 停 进 行 而 发 生变 化 。 

实际 上 ， 在 内 存 分 配 过 程 中 ， 链 表 中 的 结 点 大 小 不 同 ， 所 以 在 结 点 结构 的 描述 上 还 需 
要 增加 存储 空间 的 大 小 域 size， 用 size 描述 空闲 块 的 存储 量 。 当 然 要 求 每 个 结 点 描述 的 空 
闻 是 地 址 连续 的 存储 空间 (如 图 9-4 所 示 )， 但 是 当 需 要 将 空闲 块 合并 时 ， 特 别 是 前 面 有 相 
邻 的 空闲 块 ， 需 要 能 够 查询 当前 块 是 否 是 空闲 ， 在 空闲 块 的 末尾 增加 一 个 tag 位 ， 还 需要 
能 够 从 末尾 位 置 直接 找到 当前 块 的 首 地 址 ， 因 此 在 末尾 还 需要 增加 一 个 指针 ， 指 向 该 空闲 
块 的 首 地 址 (uplink)。 





图 9-4 Fr 点 结构 


0 ”空闲 块 
Tag=a、 


1 ”占用 块 


size 表示 空 亲 决 的 大 小 ，link 指针 指向 下 “个 空闲 块 ，wplink 指针 指向 该 空 闻 块 的 首 
地 址 。 | 
”此 时 分 配 空间 时 ， 如 果 空 亲 块 的 大 小 是 n， 程序 需要 分 配 m 个 存储 空间 此 时 分 配 一 
个 结 扣 时 还 剩 下 nn - m( 假 设 n>m) 个 空间 ， 而 hn- m 个 空间 仍然 存在 空闲 表 中 ， .对 应 的 个 | 
空间 的 标志 起 位 为 1， 表 示 已 经 被 占用 ; 而 n - mm 个 空闲 空间 的 标志 位 为 0， 表 示 当 前 块 仍然 
是 空闲 块 。 值 得 注意 的 是 ， 标 志 位 有 两 个 ， 首 标志 位 和 末尾 标志 位 。 因 为 查找 空间 时 ， 总 
是 需要 的 空间 要 小 于 将 要 分 配 的 空间 ， 可 能 会 出 现 分 配 完 空 间 后 ， 剩 余 的 空间 不 能 够 被 其 
他 的 程序 或 数据 使 用 ， 这 些小 的 空闲 块 称 为 “碎片 ”。 如 果 剩 余 若 干 个 比较 小 的 空闲 块 时 ， 
可 能 造成 空间 不 能 用 的 情况 。 通 常 采用 3 种 不 同 的 分 配 策略 。 
(1) 首次 拟 合 法 
首次 拟 合 法 的 基本 思想 是 : 从 表 头 指针 开始 查找 可 利用 空间 表 ， 将 找到 的 第 一 个 大 小 
不 小 于 产 的 空闲 块 的 一 部 分 分 配给 用 户 。 可 利用 空间 表 本 身 既 不 按 结 点 的 初始 地 址 有 序 ， 
也 不 按 结 点 的 大 小 有 序 。 则 在 回收 时 ， 只 要 将 释放 的 空闲 块 插入 在 链表 的 表 头 即 可 。 
首次 拟 合法 明显 有 以 下 两 个 缺点 ， 
e。 系统 工作 一 段 时 间 后 ， 空 闲 表 中 剩 下 的 空闲 块 可 能 都 是 一 些 零碎 的 小 空闲 块 ， 即 产 
生 “ 碎 片 ”， 而 这 些 “ 碎 片 ” 又 不 足以 为 其 他 的 任何 程序 或 数据 所 利用 ， 造 成 空间 
的 大 量 浪费 。 
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e 为 了 碍 找 一 个 适合 用 户 的 空 亲 块 ,每 次 需要 从 链表 的 表 头 开始 进行 搜索 ,而 那些 比 
较 小 的 空闲 块 往往 集中 在 链表 的 前 部 ， 伍 找 的 效率 非常 低 。 

鉴于 首次 拟 合法 的 不 足 ， 可 将 算法 做 如 下 一 些 改进 : 

。 将 可 用 链表 改 成 双向 循环 链表 。 这样 , 删除 某 链 结 点 时 很 容易 找到 其 直接 前 趋 结 点 。 

e 将 回 定 的 头 指针 改 为 活动 指针 。 每 次 分 配 以 后 那些 零碎 目 由 块 都 集中 在 表 的 前 部 ， 

只 要 将 刚刚 分 配 的 结 点 作为 下 次 搜索 的 起 始 位 置 , 这 样 可 以 向 后 搜索 ， 从 而 提高 查 
找 效率 。 

e 确定 一 个 e， 当 某 个 自由 块 分 配 后 剩 下 的 内 存 不 足 gs 时 ， 便 将 该 自由 块 全 部 分 配给 
某 段 程序 ， 并 将 其 从 空闲 链表 中 删除 。 

e 当 分 配 块 返 回 可 用 表 时 ， 先 检查 其 物理 上 邻接 的 存储 块 是 否 在 可 用 空闲 表 中 。 若 在 
表 中 ， 则 把 释放 的 分 配 块 合并 于 该 物理 邻接 的 空闲 块 ; 否则 ， 释 放 的 分 配 块 作为 一 
个 新 的 空闲 块 插 入 到 可 用 空闲 表 中 。 

e 为 了 便于 判断 物理 上 邻接 的 存储 块 是 否 是 空闲 块 ,在 分 配 块 与 空闲 块 的 头 、 尾 各 设 
置 一 个 标志 TAG， 用 来 表示 该 块 是 否 为 空闲 块 。 

(2) 最 佳 拟 合法 

最 佳 拟 合法 的 基本 思想 是 ， 将 空闲 区 的 空闲 块 按 从 小 到 大 的 顺序 组 成 自由 链 ， 当 用 户 
申请 一 个 空 用 区 大 小 为 n 时 ,将 在 可 利用 空间 表 中 找到 一 个 大 于 的 最 小 结 点 分 配给 用 户 ， 
(最 适合 用 户 需 要 的 空间 的 空闲 块 ) 使 空间 的 浪费 减少 到 最 少 。 如 果 n 的 值 刚刚 大 于 需要 的 
空间 ， 剩 余 的 空间 又 不 能 被 其 他 的 程序 或 数据 使 用 ， 容 易 产 生 “ 碎 片 ”。 

如 果 空 用 区 的 大 小 大 于 请 求 长 度 ， 则 减 去 请 求 长 度 n 后 ， 剩 余 的 空闲 区 部 分 仍然 按照 
剩余 的 大 小 插入 在 空 闪 表 中 (需要 在 删除 结 点 后 ,查找 插入 的 位 置 , 然后 将 结 点 插入 到 链表 
合 运 的 位 置 中 )。 这 样 最 佳 拟 合法 总 是 保证 了 空闲 区 中 的 空闲 块 按照 从 小 到 大 排列 。 但 是 浪 
费 了 大 量 的 时 间 。 

最 佳 拟 合法 的 缺点 是 :总 是 可 能 产生 碎片 ， 造 成 大 量 的 碎片 后 ， 可 能 形成 某 个 申请 空 
回 分配 不 到 ， 但 是 所 有 的 碎片 总 和 能 够 满足 该 申请 ;查找 时 间 延 长 ， 因 为 自由 链 中 的 空闲 
块 按照 从 小 到 大 排列 ， 每 次 分 配 总 是 从 头 到 尾 查找 ， 造 成 查找 时 间 延 长 。 

解决 方案 : 一 旦 剩余 的 空间 小 于 某 个 特定 的 值 ， 此 时 将 它 直接 分 配给 程序 或 数据 即 可 ， 
不 会 产生 “碎片 ”; 解决 时 间 问 题 ， 可 以 采用 双向 链表 ， 径 可 以 向 后 查找 ， 又 可 以 向 前 查 
找 ， 减 少 从 头 扫描 时 间 ， 或 者 采用 活动 的 头 指针 。 

(3) 最 差 拟 合法 

与 最 佳 拟 合法 相反 ， 最 差 拟 合法 是 将 所 有 的 空闲 块 按照 从 大 到 小 的 顺序 存储 ， 尽 量 避 
免 产 生 碎片 。 最 差 拟 合法 的 基本 思想 是 .将 在 可 利用 的 空间 表 中 找到 一 个 最 大 的 空闲 块 分 
配给 用 户 ， 使 得 分 配 空间 尽 可 能 地 满足 用 户 的 需要 。 

当 用 刀 申 请 空间 时 ， 总 是 从 当前 最 大 的 空闲 块 中 划分 空间 给 用 户 ， 空 间 大 小 减 去 请 求 
长 度 了 后 ,剩余 的 空闲 区 部 分 仍然 按照 剩余 的 大 小 插入 在 空闲 表 中 (需要 在 删除 结 点 后 ， 查 
找 插入 的 位 置 ,然后 将 结 点 插入 到 链表 合适 的 位 置 中 )。 这样 最 差 拟 合法 总 是 保证 了 空闲 区 
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中 的 空闲 块 按照 从 大 到 小 排列 。 

最 差 拟 合 法 的 缺点 是 : 总 是 分 配 最 大 的 空间 ， 使 最 大 空间 逐渐 变 小 ， 可 能 导致 某 个 用 
户 申 请 的 空间 不 能 够 得 到 满足 。 

解决 方案 是 : 使 用 最 佳 拟 合 法 或 者 释放 空间 时 ， 尽 量 将 相 邻 空间 合并 为 更 大 的 空间 ， 
保证 大 程序 的 运行 ， 或 者 采用 活动 的 头 指针 以 减少 查找 时 间 。 

(4) 几 种 分 配 算法 的 比较 

上 面 讨论 了 3 种 常用 的 内 存 分 配 算法 及 回收 算法 。 由 于 回收 后 的 空闲 区 要 插入 可 用 表 
或 自由 链 中 ， 而 且 可 用 表 或 自由 链 是 按照 一 定 顺 序 排列 的 。 所 以 ， 除 了 搜索 查找 速度 与 所 
找到 的 空间 区 是 否 最 佳 ， 释 放空 闪 区 的 速度 也 对 系统 开销 产生 影响 。 下 面 从 查找 速度 、 释 
放 速 度 及 空闲 区 的 利用 等 3 个 方面 对 上 述 3 种 算法 进行 比较 。 

首先 ， 从 搜索 速度 上 看 ， 首 次 拟 合法 具有 最 佳 性 能 。 尽 管 最 佳 拟 合法 或 最 差 拟 合法 看 
上 去 能 很 快 地 找到 一 个 最 适合 的 或 最 大 的 空闲 区 ， 但 后 两 种 算法 都 要 求 首先 把 不 同 大 小 的 
空闲 区 按 其 大 小 进行 排队 ， 这 实际 上 是 对 所 有 空闲 区 进行 一 次 搜索 。 再 者 ， 从 回收 过 程 来 
看 ， 首 次 拟 合法 也 是 最 佳 的 。 因 为 使 用 首次 拟 合法 回收 某 一 空闲 区 时 ， 无 论 被 释放 区 是 和 否 
与 空闲 区 相 邻 , 都 不 用 改变 该 区 在 可 用 表 或 自由 链 中 的 位 置 , 只 需 修改 其 大 小 或 起 始 地 址 。 
而 最 佳 拟 合法 和 最 差 拟 合法 都 必须 重新 调整 该 区 的 位 置 。 

首次 拟 合 法 的 男 一 个 优点 就 是 尽 可 能 地 利用 了 低地 址 空间 ， 从 而 保证 高 地 址 有 较 大 的 
空闲 区 来 放置 要 求 内 存 较 多 的 进程 或 作业 。 

反 过 来 ， 最 佳 拟 合法 找到 的 空闲 区 是 最 佳 的 ， 也 就 是 说 ， 用 最 佳 拟 合法 找到 的 空闲 区 
或 者 是 正好 等 于 用 户 请 求 的 大 小 或 者 是 能 满足 用 户 要 求 的 最 小 空 亲 区。 不过， 尽管 最 佳 拟 
合法 能 选 出 最 适合 用 户 要 求 的 可 用 空闲 区 ， 但 这 样 做 在 某 些 情况 下 并 不 一 定 提高 内 存 的 利 
用 率 。 例 如 ， 当 用 户 请 求 小 于 最 小 空 闪 区 不 太 多 时 ， 分 配 程序 会 将 其 分 配 后 的 剩余 部 分 作 
为 一 个 新 的 小 空闲 区 留 在 可 用 表 或 自由 链 中 。 这 种 小 空 闪 区 (碎片 ) 有 可 能 永远 得 不 到 再 利 
用 (除非 与 别 的 空闲 区 合并 )， 而 且 也 会 增加 内 存 分 配 和 回收 时 的 查找 负担 。 

最 差 拟 合法 正 是 基于 不 留 下 碎片 空闲 区 这 一 出 发 点 的 (为 解决 最 佳 拟 合法 的 缺点 )。 它 
选择 最 大 的 空闲 区 来 满足 用 户 要 求 ， 以 期 分 配 后 的 剩余 部 分 仍 能 进行 再 分 配 ， 但 是 对 于 大 
的 空闲 块 的 不 断 划 分 ， 容 易 引 起 要 求 大 容量 内 存 的 进程 或 作业 不 能 满足 的 情况 。 

总 之 ， 上 述 3 种 算法 各 有 特长 ， 针 对 不 同 的 请 求 队列 ， 效 率 和 功能 是 不 一 样 的 。 

因此 不 同 的 情景 需要 采用 不 同 的 方法 ， 通 常 在 选择 时 需要 考虑 以 下 因素 : 用 户 的 逻辑 
要 求 ， 请求 分 配 量 的 大 小 分 布 ， 分 配 和 释放 的 频率 以 及 效率 对 系统 的 重要 性 等 。 

在 实际 使 用 的 系统 中 回收 空 闪 块 时 ， 还 需要 考虑 一 个 结 点 的 合并 问题 。 因 为 在 系统 不 
断 地 进行 分 配 和 回收 的 过 程 中 ， 大 的 空闲 块 逐渐 被 划分 为 小 的 占用 块 ， 在 它们 重新 成 为 空 
闲 块 回收 后 ， 即 使 地 址 相 邻 的 两 个 空闲 块 也 要 作为 两 个 结 点 插入 到 可 利用 空间 表 中 ， 导 致 
后 来 出 现 的 大 容量 的 请 求 分 配 无 法 进行 。 为 了 更 加 有 效 地 利用 内 存 ， 就 要 求 系统 在 回收 时 
应 考虑 将 地 址 相 邻 的 空闲 块 合并 成 尽 可 能 大 的 结 点 。 也 就 是 说 ， 在 回收 空闲 块 时 ， 应 首先 
检 栓 地 址 与 它 相 邻 的 内 存 是 否 是 空闲 块 ， 如 果 是 就 将 它们 合并 后 ， 作 为 一 个 空闲 块 存 在 自 
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由 链 中 ， 香 则 只 要 将 空闲 块 直 接 插入 到 自由 链 中 即 可 。 
9.4 存储 基 缩 


动态 仓储 管理 内 和 本， 可 以 采用 男 外 一 种 动态 存储 管理 一 一 存储 紧缩 。 具 体 方法 是 : 在 
整个 动态 存储 官 理 过 程 中 ， 不 管 哪个 时 刻 ， 可 利用 空间 都 是 一 个 连续 的 存储 区 ， 在 编译 过 
程 中 称 为 “ 堆 ”， 每 次 分 配 都 是 从 这 个 可 利用 空间 中 划 出 一 块 ， 释 放 ( 回 收 ) 时 ， 必 须 将 回 
收 的 空闲 抉 合并 到 整个 堆 中 ， 才 能 够 重新 使 用 ， 也 就 是 存储 紧缩 。 

堆 的 实现 方法 :设立 一 个 指针 ， 称 为 堆 指 针 ， 始 终 指 向 堆 的 最 低 (或 最 高 ) 地 址 。 当 用 
成 申请 NN 个 存储 块 时 ， 堆 指针 同 高 地 址 (或 低地 址 ) 移 动 N 个 存储 单位 ， 移 动 之 前 的 指针 就 
是 分 配给 用 户 的 占用 块 的 初始 地 址 。 : 

因为 可 利用 空间 是 连续 的 ， 所 以 利用 堆 指 针 实 现 地 址 分 配 非常 方便 ， 但 是 回收 用 户 释 
放 的 空间 就 比较 麻烦 。 一 般 有 两 种 方法 : 

e 一 旦 有 用 户 释 放 存 储 块 即 进行 回收 紧缩 ; 

e 在 程序 执行 过 程 中 不 回收 用 户 随 时 释放 的 存储 块 ， 直到 可 利用 空间 不 够 分 本 或 堆 指 

针 指 回 最 高 地 址 时 才 进 行 存 储 紧 缩 。 

存储 紧缩 的 目的 是 将 堆 中 所 有 的 空 闪 块 连 成 一 片 。 

为 实现 存储 紧缩 ， 首 先 要 对 占用 块 进行 “标志 ”， 标 志方 法 和 9.3 节 介 绍 的 类 同 (存储 
块 的 结构 可 能 不 同 )， 其 次 需 进行 下 列 4 步 操作 : 

e 计算 占用 块 的 新 地 址 。 从 最 低地 址 开始 巡查 整个 存储 空间 ， 对 每 一 个 占用 块 找到 它 

在 票 缩 后 的 新 地 址 。 为 此 ， 需 设立 两 个 指针 随 巡 查 向 前 移动 ， 这 两 个 指针 分 别 指示 
占用 块 在 紧缩 之 前 和 之 后 的 原 地 址 和 新 地 址 。 因 此, 在 每 个 占用 块 的 第 一 个 存储 单 
位 中 , 除了 设立 长 度 域 (存储 该 占用 块 的 大 小 ) 和 标志 域 (存储 区 别 该 存储 块 是 占用 块 
或 空闲 块 的 标志 ) 之 外 ， 还 需 设 立 一 个 新 地 址 域 ， 以 存储 占用 块 在 紧缩 后 应 有 的 新 
地 址 ， 即 建立 一 张 新 、 旧 地 址 的 对 照 表 。 

e 修改 用 户 的 初始 变量 表 ， 以 便 在 存储 紧缩 后 用 户 程序 能 继续 正常 运行 。 

e 检查 每 个 占用 块 中 存储 的 数据 。 若 有 指向 其 他 存储 块 的 指针 ， 则 需 作 相应 地 修改 。 

e 将 所 有 占用 块 迁 移 到 新 地 址 去 。 

至 此 ,完成 了 存储 紧缩 的 操作 。 最 后 ， 将 堆 指针 赋 以 新 值 ( 即 紧缩 后 的 空 闪存 储 区 的 最 
低地 址 )。 可 见 ， 存 储 紧 缩 法 不 仅 要 传送 数据 (进行 占用 块 迁移 )， 而 且 要 修改 所 有 占用 块 中 
的 指针 值 。 因 此 ， 存 储 紧 缩 是 一 个 系统 操作 ， 除 非 迫不得已 ， 否 则 就 不 用 。 

存储 紧缩 时 ， 一 般 有 4 种 情况 可 以 考虑 : 

e。" 释放 的 空间 前 后 都 没有 相 邻 的 空闲 块 ， 

e 释放 的 空间 前 有 相 邻 的 空闲 块 ; 

e 释放 的 空间 后 有 相 邻 的 空闲 块 ; 
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。 释放 的 空间 前 后 都 有 相 邻 的 空闲 块 。 

以 上 4 种 情况 能 够 合并 空间 的 尽量 合并 空间 ， 不 能 够 合并 的 则 直接 插入 到 空闲 表 中 即 可 。 

对 于 第 1 种 情况 ， 直 接 将 结 点 的 标志 位 tag 置 为 0( 注 意 是 两 个 标志 位 )， 然 后 插入 到 空 
闲 表 中 即 可 。 

对 于 第 2 种 情况 ,假设 将 要 释放 的 结 点 是 p， 只 要 检查 当前 结 点 p -1 位置 上 的 标志 位 
是 否 等 于 0 即 可 ， 如 果 等 于 0， 说 明 该 结 扣 前 面 的 结 点 是 空闲 块 ， 可 以 将 结 点 与 其 前 面 的 
结 点 合并 。 合 并 方法 是 : 找到 p -1 位 置 上 的 uplink， 可 以 找到 前 面 结 点 的 首 地 址 ， 假 设 是 
gg， 将 g 的 size 改 为 两 个 结 点 的 size 之 和 。 通 过 将 p 结 点 的 末尾 标记 位 (ptsize - 1 的 tag) 置 
为 0， 同时 将 ptsize -1 地 址 上 的 uplink 改 为 gq( 合 并 新 结 扣 的 首 地 址 )， 完 成 了 两 个 结 点 的 
合并 。 

对 于 第 3 种 情况 ， 假 设 将 要 释放 的 结 点 是 p， 只 要 检查 当前 结 点 ptsize 位 置 上 的 标志 
位 是 否 等 于 0 即 可 ， 如 果 等 于 0， 说 明 该 结 点 后 面 的 结 点 是 空闲 块 ， 可 以 将 结 点 与 其 后 面 
的 结 点 合并 。 合 并 方法 是 : 找到 ptsize 的 地 址 ， 假 设 为 9， 通过 5 可 以 找到 g+size - 1 对 应 
结 氮 的 uplink， 将 此 uplink 的 值 改 为 p， 同 时 将 p 的 size 改 为 两 个 结 点 的 size 之 和 ,将 p 
的 标志 位 tag 改 为 0 即 可 。 

对 于 第 4 种 情况 ， 既 要 检查 p- 1 的 标志 位 是 否 为 0， 又 要 检查 ptsize 的 tag 位 是 否 为 
0。 如 果 都 为 0， 说 明 该 结 点 前 、 后 面 的 结 点 是 空闲 块 ， 可 以 将 结 点 与 其 前 、 后 面 的 结 点 合 
并 。 合 并 方法 同 第 2 种 情况 ， 只 是 在 修改 uplink 时 ， 应 该 是 后 面 结 点 的 uplink。 同 时 size 
应 该 是 3 个 结 点 的 size 之 和 。 : : 

以 上 4 种 情况 ， 只 要 使 用 switch 语句 ， 分 开 处 理 即 可 。 


思考 和 练习 


(1) 动态 存储 管理 中 内 存 分 配方 法 通常 有 几 种 ? 比较 它们 的 优 缺 点 。 
(2) 与 出 首次 拟 合法 流程 框图 。 

(3) 针对 不 同 的 内 存 分 配方 法 的 缺点 ， 设 计 相 应 的 存储 结构 解决 它 。 
(4) 在 不 同 的 分 配方 法 中 ， 说 明 回 收 空闲 块 的 方法 。 

(5) 说 明 紧 缩 存 储 与 音 用 分 配方 法 的 不 同 。 


第 10 革 文件 


文件 是 大 量 记 录 的 集合 ， 一 般 把 主 存储 器 (内 存储 器 ) 中 的 记录 集合 称 为 表 ， 把 存储 在 
外 存储 器 中 的 记录 集合 称 为 文件 。 本 章 讨论 在 外 存储 器 中 的 文件 的 表示 方法 及 其 运算 的 实 
现 方 法 。 


本 章 的 学 习 目 标 : 

e 文件 存储 器 ; 
文件 的 逻辑 结构 ; 
索引 文件 

散 列 文件 。 


10.1 ”文件 的 基本 概念 


10.1.1 文件 定义 


算法 和 数据 结构 的 实现 既 可 以 基于 主 存 储 器 ， 也 可 以 基于 辅助 存储 器 ， 在 前 面 的 章节 
中 通常 考虑 使 用 的 是 主 存 储 器 ， 但 使 用 不 同 的 存储 器 ( 主 、 辅 助 存储 器 ) 会 直接 影响 算法 和 
数据 结构 的 设计 。 文 件 是 性 质 相 同 的 记录 的 集合 ， 下 (和 明生 博 禹 ) 本 
章 主 要 考虑 外 存储 器 。 

文件 通常 存储 在 外 存 ( 辅 助 存 储 器 ) 上 ， 对 文件 的 操作 就 要 考虑 文件 的 存储 介质 问题 
因为 存储 介质 的 不 同 , 数据 的 访问 速度 、 数 据 的 存储 量 以 及 数据 的 存 取 方 法 等 可 能 就 不 同 ， 
而 以 上 的 因素 就 可 能 决定 了 算法 的 实现 。 

操作 系统 的 文件 是 一 维 的 、 连 续 的 字符 序列 ， 无 结构 、 无 解释 : 它 也 是 记录 的 集合 ， 
用 户 为 了 人 存 取 、 加 工 方便 ， 把 文件 中 的 信息 划分 成 者 干 组 ， 每 一 组 信息 称 为 逻辑 记录 ， 并 
且 可 按 顺 序 编号 。 

数据 库 中 的 文件 是 带 有 结构 的 记录 的 集合 。 记 录 是 由 一 个 或 多 个 数据 项 组 成 的 集合 ， 
它 也 是 文件 存 取 的 数据 的 基本 单位 。 

在 文件 中 常见 的 术语 有 : / : 

e 记录 是 文件 中 和 存 取 的 基本 单位 ， 数 据 项 是 文件 可 使 用 的 最 小 单位 。 

e 数据 项 有 时 也 称 为 字段 ， 或 者 称 为 属性 。 
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。 主 关键 字 项 “其 值 能 惟一 标识 一 个 记录 的 数据 项 或 数据 项 的 组 合 。 
。 次 关键 字 项 “其 值 不 能 惟一 标识 一 个 记录 的 数据 项 。 
。 主 关键 字 ( 或 次 关键 字 ) 主 关键 字 项 (或 次 关键 字 项 ) 的 值 称 为 主 关键 字 ( 或 次 关 
键 字 )。 
有 时 为 描述 方便 , 将 主 (或 次 ) 关 键 字 项 简称 为 主 (或 次 ) 关 键 字 ,并 且 假 定 主 关键 字 项 只 
含 一 个 数据 项 。 
e。 单 关键 字 文件 文件 中 的 记录 只 有 一 个 惟一 标志 记录 的 主 关 键 字 。 
。 多 关键 字 文件 “文件 中 的 记录 除 有 一 个 惟一 标志 记录 的 主 关键 字 外 , 还 含有 若干 个 
次 关键 字 。 
按照 构成 文件 的 记录 结构 的 长 度 分 为 定 长 记录 文件 和 不 定 长 记录 文件 。 
文件 中 记录 含有 的 信息 长 度 相 同 ， 称 为 定 长 记录 ， 由 定 长 记录 组 成 的 文件 称 为 定 长 文 
件 。 若 文件 中 记录 含有 的 信息 长 度 不 等 ， 则 称 为 不 定 长 文件 。 


10.1.2 文件 逻辑 结构 及 操作 


记录 的 逻辑 结构 是 指 记录 在 用 户 或 应 用 程序 员 面 前 呈现 的 方式 ， 是 用 户 对 数据 的 表示 
和 存 取 方 式 。 | 

文件 是 性 质 相 同 的 记录 的 集合 ， 简 单 地 说 ， 文 件 可 以 被 认为 是 每 条 记录 为 一 行 的 二 维 
表格 ， 如 果 把 记录 简略 成 结 点 (此 时 可 以 以 关键 字 作 为 记录 的 惟一 标识 )， 那 么 文件 中 每 个 
记录 最 多 只 有 一 个 直接 后 继 记 录 和 一 个 直接 前 趋 记录 ， 而 文件 的 第 一 个 记录 只 有 后 继 没有 
前 趋 ， 文 件 的 最 后 一 个 记录 只 有 前 趋 而 没有 后 继 。 因 此 ， 文 件 可 看 成 是 一 种 线性 结构 。 

记录 的 物理 结构 是 数据 在 物理 存储 器 上 的 存储 方式 ， 是 数据 的 物理 表示 和 组 织 。 

文件 的 物理 结构 是 指 文件 在 存储 介质 上 的 组 织 方式 。 

记录 的 逻辑 结构 和 物理 结构 的 着 眼 点 不 同 ， 逻 辑 结构 主要 是 让 用 户 使 用 方便 ， 而 物理 
结构 则 主要 是 提高 存储 空间 的 利用 率 和 减少 存 取 时 间 ， 它 根据 需要 及 设备 本 身 的 特性 有 很 
多 种 方式 。 

对 应 不 同 结构 的 记录 也 分 别称 为 物理 记录 和 风 辑 记录 ， 两 种 不 同 的 记录 是 两 个 不 同 
的 概念 。 物 理 记录 是 指 计算 机 使 用 一 条 1/O 指令 进行 读 / 写 的 基本 数据 单位 ， 对 固定 设备 
而 言 ， 它 的 大 小 基本 上 固定 不 变 ， 而 逻辑 记录 的 大 小 则 是 由 使 用 要 求 决定 的 ， 它 们 之 间 
有 以 下 关系 : 

。 一 条 物理 记录 存放 一 条 逻辑 记录 。 

”一 条 物理 记录 存放 多 条 逻辑 记录 。 

。 多 条 物理 记录 存储 一 条 罗 辑 记录 ， 

用 户 在 使 用 逻辑 记录 时 ， 可 以 不 必 关 心 物理 记录 的 存储 位 置 ， 它 们 之 间 的 地 址 转换 以 
及 存 取 由 操作 系统 实现 。 

晶 用 户 在 使 用 文件 时 必须 对 其 进行 必要 的 操作 。 对 文件 的 操作 有 很 多 种 ， 文 件 的 操作 
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主要 有 检索 和 维护 。 检 索 是 在 文件 中 查找 满足 给 定 条 件 的 记录 。 维 护 主 要 是 对 文件 进行 记 
录 的 插入 、 删 除 及 修改 等 更 新 操作 。 
其 中 文件 的 检索 有 3 种 方式 : 
e 顺序 存 取 ， 按 记录 号 依次 存 取 逻 辑 记 录 。 
e 直接 存 取 按照 记录 号 或 记录 的 相对 位 置 直 接 取 得 需要 的 记录 。 
e 按 关 键 字 存 取 给 定 一 个 关键 字 的 值 ， 碍 询 一 个 或 多 个 关键 字 与 给 定 值 相关 的 记 
录 ， 一 般 有 4 种 查询 方法 。 
0 简单 查询 : 查询 关键 字 等 于 给 定 值 的 记录 。 例 如 查询 学 号 是 00001 的 记录 。 
0 区 域 查询 : 查询 关键 字 属 于 某 个 范围 的 记录 。 例 如 查询 成 绩 在 80 分 以 上 的 所 有 
记录 。 
0 项 数理 询 : 给 定 关 键 字 的 值 使 函数 成 立 的 记录 。 例 如 查询 所 有 男生 的 记录 。 
9 布尔 查询 : 通过 布尔 运算 组 合 起 来 的 查询 。 例 如 查询 男生 中 成 绩 在 90 分 以 上 的 
2003 届 的 所 有 记录 。 


10.2 ”文件 的 分 类 


文件 按 不 同 的 组 织 方式 可 以 分 为 若干 种 ， 其 基本 组 织 形 式 分 为 顺序 组 织 、 索 引 组 织 、 
散 列 组 织 和 链 组 织 。 对 应 文件 的 分 类 一 般 有 顺序 文件 、 索 引文 件 、 直接 存 取 文 件 ( 散 列 文件 ) 
和 多 关键 字 文件 等 。 按 记录 的 特性 来 分 类 ， 可 以 将 文件 分 为 定 长 记录 文件 (文件 中 每 条 记录 
含有 的 信息 长 度 相 等 ) 和 不 定 长 记录 文件 (文件 中 含有 的 信息 长 度 不 相等 )。 


10.2.1 顺序 文件 


记录 按 其 在 文件 中 的 逻辑 顺序 依次 存 入 存储 介质 所 建立 的 文件 称 为 顺序 文件 。 顺 序 文 
件 是 根据 记录 的 序号 或 记录 的 相对 位 置 来 进行 存 取 的 文件 组 织 方式 。 

顺序 文件 中 如 果 次 序 相连 的 两 条 记录 在 存储 介质 上 的 存储 位 置 是 相 邻 的 ， 称 为 连续 文 
件 ， 反 之 称 为 串联 文件 。 , 

其 特点 是 ; 

e@ 存 取 第 I 个 记录 ， 必 须 先 搜索 第 1- 1 个 记录 。 

e 插入 新 的 记录 时 只 能 加 在 文件 的 末尾 。 

e 右 要 更 新 文件 中 的 某 个 记录 ， 则 必须 将 整个 文件 进行 复制 。 

顺序 文件 的 优点 是 连续 存 取 的 速度 快 ， 因 此 主要 用 于 只 进行 顺序 存 取 、 批 量 修 改 的 情 
况 。 顺 序 文件 的 存储 介质 比较 典型 的 是 磁带 。 
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10.2.2 索引 文件 


“1. 索引 文件 概述 


索引 文件 由 索引 区 和 文件 数据 区 两 部 分 组 成 ， 其 中 文件 数据 区 按 关 键 字 有 序 的 称 为 索 
引 顺 序 文 件 ， 文 件数 据 区 中 记录 不 按 关键 字 顺 序 排列 称 为 索引 非 顺 序 文件 。 索 引 非 顺序 文 
件 通 常 是 指 索 引文 件 。 

索引 区 指明 逻辑 记录 和 物理 记录 之 间 一 一 对 应 关系 ， 称 为 索引 表 。 一 般 索 引 表 由 索引 
项 组 成 ， 索 引 项 一 般 有 两 部 分 :关键 字 和 关键 字 对 应 的 记录 地 址 。 

数据 区 和 索引 表 构 成 索引 文件 (如 图 10-1 所 示 )。 





索引 区 基本 数据 区 
图 10-1 索引 文件 结构 


根据 关键 字 和 记录 地 址 是 否 一 一 对 应 可 以 将 索引 文件 分 为 稠密 索引 和 稀疏 索引 两 类 。 
e。 稠密 索引 : 对 于 索引 非 顺序 文件 ， 由 于 主 文件 中 记录 是 无 序 的 ， 则 必须 为 每 个 记录 
建立 一 个 索引 项 ， 这 样 建立 的 索引 表 称 为 稠密 索引 。 
e。 稀疏 索引 ， 对 于 索引 顺序 文件 ， 由 于 主 文件 中 记录 按 关键 字 有 序 ， 则 可 对 一 组 记录 
建立 一 个 索引 项 ， 称 为 稀疏 索引 。 
索引 文件 在 存储 器 上 分 为 两 个 区 :索引 区 和 数据 区 。 前 者 存放 索引 表 ， 后 者 存放 主 文 
件 (数据 )。 
建立 索引 文件 的 主要 目的 是 提高 查询 速度 ， 对 索引 文件 而 言 其 检索 步骤 为 ， 首 先 将 外 
存 上 含有 索引 区 的 页 块 送 入 内 存 ， 查 找 所 需 记 录 的 物理 地 址 ， 然 后 再 将 该 记录 的 页 块 送 入 
内 存 。 若 索引 表 不 大 ， 则 可 将 索引 表 一 次 读 入 内 存 。 因 此 在 索引 文件 中 进行 检索 只 需 两 次 
访问 外 存 : 一 次 读 索 引 ， 一 次 读 记 录 。 
索引 文件 插入 时 , 将 插入 记录 置 于 数据 区 的 末尾 ， 并 在 索引 表 中 插入 索引 项 ; 删除 时 ， 
删 去 相应 的 索引 项 ， 若 要 修改 主 关键 字 ， 则 必须 同时 修改 索引 表 。 
当 索 引 表 很 大 时 ， 一 个 页 块 容纳 不 下 ， 查 阅 索 引 仍 要 多 次 访问 外 存 。 因 此 ， 可 以 对 索 
引 表 建 立 一 个 索引 ， 称 为 查找 表 。 
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多 级 索引 是 一 种 静态 索引 ， 各 级 索引 均 为 顺序 表 ， 修 改 不 方便 ， 每 次 修改 都 要 重组 索 
引 。 因 此 ， 当 数据 文件 在 使 用 过 程 中 记录 变动 较 多 时 ， 应 采用 动态 索引 。 

建立 索引 文件 主要 是 如 何 组 织 文件 的 索引 ， 特 别 是 多 级 索引 时 需要 建立 M 分 查找 树 ， 
一 般 主 要 使 用 B- 树 和 B+ 树 。 

B- 树 和 B+ 树 的 操作 主要 是 对 B- 树 和 B+ 树 的 结 点 的 插入 、 删 除 和 查找 。 值得 注意 的 是 : 
B- 树 和 B+ 树 都 是 平衡 树 ; B- 树 中 的 结 点 值 都 是 关键 字 , 而 B+ 树 中 的 关键 字 都 在 叶 结 点 上 ， 
即 所 有 的 叶 结 点 都 是 关键 字 ， 内 部 结 点 都 是 临时 结 点 。 


2. 索引 顺序 文件 


索引 非 顺序 文件 适合 于 随机 存 取 ， 不 适合 于 顺序 存 取 。 索 引 顺 序 文件 既 适合 于 随机 存 
取 ， 义 运 合 于 顺序 存 取 。 索 引 顺 序 文件 是 稀 玻 索 引 ， 占 用 空间 较 少 。 而 索引 非 顺序 文件 是 
稠密 索引 。 
(1) ISAM( 索 引 顺 序 存 取 方 法 ) 
”ISAM 是 一 种 专 为 磁盘 存 取 文 件 设计 的 文件 组 织 形式 ， 采 用 静态 索引 结构 。 
ISAM 文件 由 多 级 主 索引 、 柱 面 索 引 、 磁 道 索引 和 主 文 件 组 成 (如 图 10-2 所 示 )。 


基本 索引 项 溢出 索引 项 
10-2 ”磁道 索引 项 结构 


文件 的 记录 在 同一 盘 组 上 存放 时 ， 应 先 集中 放 在 一 个 柱 面 上 ， 然 后 顺序 存放 在 相 邻 的 
柱 面 上 ; 对 同一 柱 面 则 应 按 盘 面 的 次 序 顺序 存放 。 

为 所 局 检索 速率 ， 通 常 可 让 主 索引 常 驻 内 存 ， 并 将 柱 面 索 引 放 在 数据 文件 所 占 空 间 居 
中 位 置 的 柱 面 上 ， 目 的 是 使 磁头 移动 距离 的 平均 值 最 小 。 

当 插 入 新 记录 时 ， 首 先 找到 它 应 插入 的 磁道 。 若 该 磁道 不 满 ， 则 将 新 记录 插入 该 磁道 
的 适当 位 置 上 即 可 ， 若 该 磁道 已 满 ， 则 新 记录 或 者 插 在 该 磁道 上 ， 或 者 直接 插入 到 该 磁道 
的 洲 出 链表 上 。 插 入 后 ， 可 能 要 修改 磁道 索引 中 的 基本 索引 项 和 溢出 索引 项 。 

删除 记录 时 ， 只 要 找到 待 删除 的 记录 ， 在 其 存储 位 置 上 作 删 除 标 记 即 可 ， 不 需要 移动 

通 节 需要 定期 整理 ISAM 文件 ， 因 为 经 常 对 文件 记录 的 删 、 增 ， 造 成 大 量 记 录 进 入 数 
握 盗 出 区 ， 而 基本 区 中 的 空间 没有 充分 利用 ， 造 成 基本 区 的 空间 浪费 。 

(2) VSAM 

VSAM( 虚 拟 存储 存 取 方 法 ) 是 一 种 索引 顺序 文件 的 组 织 方 式 ， 一 般 采 用 B+ 树 作为 动态 
索引 结构 。 

B+ 树 是 一 种 常用 于 文件 组 织 的 B- 树 的 变种 树 。 一 棵 m 阶 的 B+ 树 和 m 阶 的 B- 树 的 差 
弄 是 : 

e 有 上 个 孩子 的 结 点 必 有 上 个 关键 字 ; 
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e 所 有 的 叶 结 点 , 包含 了 全 部 关键 字 的 信息 及 指向 相应 记录 的 指针 ， 且 叶子 结 点 本 身 

依照 关键 字 的 大 小 ， 从 小 到 大 顺序 链接 ; 

e 上 面 各 层 结 点 中 的 关键 子 ， 均 是 下 一 层 相 应 结 点 中 最 大 关键 字 的 复写 (当然 也 可 采 

用 “最 小 关键 字 复 写 ” 的 原则 }， 因 此 ， 所 有 非 叶 结 点 可 看 作 是 索引 部 分 ; 
® B+ 的 查找 必须 查找 到 叶 结 点 为 止 ， 因 为 非 末 端 结 点 只 是 起 到 了 分 界 作 用 ， 其 本 身 
不 是 关键 字 。 

可 以 对 B+ 树 进行 两 种 查找 运算 : 一 种 是 从 最 小 关键 字 起 进行 顺序 查找 ; 另 一 种 是 从 根 
结 点 开始 进行 随机 查找 。 

在 B+ 树 上 进行 随机 查找 、 插 入 和 删除 的 过 程 与 B- 树 的 类 似 。 只 是 在 查找 时 ， 若 非 叶 
结 皮 上 的 关键 字 等 于 给 定 值 ， 并 不 终止 ,而 是 继续 向 下 直到 叶子 结 点 。B+ 树 查找 的 分 析 类 
似 于 B- 树 。 

B+ 树 的 插入 也 仅 在 叶子 结 点 进行 ， 当 结 点 中 的 关键 字 个 数 大 于 m 时 要 分 裂 成 两 个 结 
点 ， 它 们 所 含 关键 字 的 个 数 分 别 为 (m+1)Y2 和 (m+1yY2， 并 且 它 们 的 双亲 结 点 中 应 同时 包含 
这 两 个 结 氮 的 最 大 关键 宁 。 

B+ 树 的 删除 仅 在 叶子 结 点 进行 ， 当 叶子 结 点 中 的 最 大 关键 字 被 删除 时 ， 其 在 非 终端 结 
点 中 的 值 可 以 作为 一 个 “分 界 关 键 字 ”存在 。 若 因 删 除 而 使 结 点 中 关键 字 的 个 数 少 于 m/2 
时 ， 则 可 能 要 和 该 结 点 的 兄弟 结 点 合并 ， 合 并 过 程 和 B- 树 类 似 。 

B+ 树 每 个 叶子 结 丘 中 的 关键 字 对 应 一 个 记录 ， 适 宜 釉 密 索 引 。 若 让 叶 结 点 中 的 关键 字 
对 应 一 个 页 块 ，B+ 树 可 用 来 作为 稀 玖 索引 。 

VSAM 文件 中 没有 洲 出 区 , 解决 插入 的 方法 是 初 建文 件 时 留 出 空间 。 当 插 入 新 记录 时 ， 
大 多 数 的 新 记录 能 插入 到 相应 的 控制 区 间 内 。 所 以 在 B+ 树 中 ,， 有 时 需要 内 存 和 外 存 进行 交 
换 才 能 完成 所 需要 的 操作 。 

值得 注意 的 是 ， 为 保持 区 间 内 记录 的 关键 字 从 小 到 大 有 序 ， 需 要 将 区 间 内 关键 字 大 于 
插入 记录 关键 字 的 记录 疝 控制 信息 的 方向 移动 。 若 干 记录 插入 之 后 控制 区 间 已 满 ， 则 在 下 
一 个 记录 插入 时 ， 要 进行 控制 区 间 的 分 裂 ， 并 修改 顺序 集中 相应 索引 。 通常 控制 区 域 较 大 ， 
很 少 发 生 分 裂 的 情况 。 

在 VSAM 文件 中 删除 记录 时 ， 需 将 同一 控制 区 间 中 ， 比 删除 记录 关键 字 大 的 记录 向 前 
移动 ， 把 空间 留 给 以 后 插入 的 新 记录 。 若 整个 控制 区 间 变 空 ， 则 回收 作 空 闲 区 间 用 ， 且 需 
删除 顺序 集中 相应 的 索引 项 。 

和 ISAM 文件 相 比 ， 基 于 B+ 树 的 VSAM 文件 有 如 下 优点 : 

e 较 高 的 查找 效率 ， 查 找 一 个 后 揪 入 记录 和 查找 一 个 原 有 记录 具有 相同 的 速度 ; 

e 动态 地 分 配 和 释放 存储 空间 ， 而 且 不 必 对 文件 进行 再 组 织 。 

基于 B+ 树 的 VSAM 文件 ， 通 党 被 作为 大 型 索引 顺序 文件 的 标准 组 织 。 
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10.2.3 ”直接 存 取 文 件 ( 散 列 文件 ) 


散 列 文件 是 利用 散 列 存储 方式 组 织 的 文件 。 它 类 似 于 散 列表 ， 即 根据 文件 中 关键 字 的 
特点 ， 设 计 一 个 散 列 函数 和 处 理 冲 突 的 方法 ， 将 记录 存储 到 存储 设备 上 。 通 过 散 列 函 数 和 
关键 字 直 接 计 算 记 录 的 地 址 ， 所 以 亦 称 为 直接 存 取 文 件 。 

与 散 列表 不 同 的 是 ， 对 于 文件 来 说 ， 磁 盘 上 的 文件 记录 通常 是 成 组 存放 的 ， 若 干 个 记 
录 组 成 一 个 存储 单位 , 在 散 列 文件 中 , 这 个 存储 单位 叫做 桶 。 假如 一 个 桶 能 存放 m 个 记录 ， 
则 当 桶 中 己 有 m 个 同义词 的 记录 时 ， 存 放 第 m+l 个 同义词 会 发 生 “ 涪 出 ”。 处 理 注 出 虽 
可 采用 散 列表 中 处 理 冲突 的 各 种 方法 ， 但 对 于 散 列 文件 ， 一 般 主 要 采用 拉链 法 。 其 处 理 冲 
突 的 步骤 是 ， 当 发 生 “ 溢 出 ”时 ， 需 要 将 第 m+1l 个 同义词 存放 到 另 一 个 桶 中 ， 通 常 称 此 桶 
为 “溢出 桶 ”。 前 六 个 同义词 存放 的 桶 为 “ 基 桶 ”， 溢 出 桶 和 基 桶 大 小 相同 。 相 互 之 间 用 
指针 相 链接 。 当 基 桶 中 没有 找到 待 查 记录 时 ， 就 沿 着 指针 到 所 指 溢出 桶 中 进行 查找 。 因 此 ， 
为 提高 查找 速度 ， 同 一 散 列 地 址 的 溢出 桶 和 基 桶 在 磁盘 上 的 物理 位 置 不 要 相距 大 远 ， 最 好 
在 同一 柱 面 上 。 

在 散 列 文件 中 删 去 一 个 记录 时 ， 一 般 仅 需 对 被 删 记 录 作 删除 标记 即 可 。 

散 列 文件 的 优点 是 ;文件 随机 存放 ， 记 录 不 需 进行 排序 ， 插 入 、 删 除 方便 ， 存 取 速 度 
快 ， 不 需要 索引 区 ， 节 省 存储 空间 。 

散 列 文件 的 缺点 是 : 不 能 进行 顺序 存 取 ， 只 能 按 关键 字 随 机 存 取 ， 询 问 方式 简单 ， 大 
量 增删 后 ， 需 要 重新 组 织 文件 。 


10.2.4 多 关键 字 文 件 


1. 多 重 表 文 件 


多 重 表 文件 是 将 索引 方法 和 链接 方法 相 结合 的 一 种 组 织 方式 ， 它 对 每 个 需要 查询 的 次 
天 键 字 建立 一 个 索引 ， 同 时 将 具有 相同 次 关键 字 的 记录 链接 成 一 个 链表 ， 并 将 此 链表 的 头 
指针 、 链 表 长 度 及 次 关键 字 作为 索引 表 的 一 个 索引 项 。 

例如 : 工资 表 文 件 ， 如 表 10-1 所 示 。 


表 10-1 工 资 表 


编号 。 | 姓名 | 职称 | 基本 工资 | 津贴 | 扣除 | 工资 链 | 。 职称 甸 
1001 ET 1005 
lo02 | 李 虎 | 助 T | ao |s0 |2 | | on 
009 | FE | 高 LT | lo | 300 | io | io | oo 
lo4 | 李强 | 实 3 | so |3 |3 [nn | Na 
005 | 于 娟 | 工程 师 | ioo | 5 | so | los | ioo 
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( 续 表 ) 
编号 职称 链 
1006 高 工 1500 Null 
1007 | 李 敢 | 助 Tz | so | |30 | i108 | lo 
1008 | 内 五 | 助 T | gs0 | |30 IN | Nu 
lo009 | 张扬 | 工程 师 | lo0 | 20 | s0 | ioo | io 
Il0I0 | 张 言 | I 各 师 | loo | 20 | 8 |N | Na 


由 以 上 的 例子 可 以 看 出 ， 多 重 链表 文件 在 建立 时 是 比较 复杂 的 ， 同 时 修改 删除 时 ， 也 
同时 需要 修改 相应 的 链表 。 所 以 多 重 链表 比较 适应 于 对 已 经 建立 链表 的 项 进行 得 找 ， 运 合 
于 静态 查找 。 


2. 倒 排 文件 


倒 排 文 件 和 多 重 链 表 的 区 别 在 于 次 关键 字 索 引 的 结构 不 同 ， 倒 排 文 件 的 次 关键 字 索 引 
称 做 倒 排 表 。 具 有 相同 次 关键 字 的 记录 之 间 不 进行 链接 ， 而 是 在 倒 排 表 中 列 出 具有 该 次 关 
键 字 记录 的 物理 地 址 。 

例如: 工资 表 文 件 。 


数据 文件 如 表 10-2 所 示 。 
表 10-2 数据 文件 表 
编号 | 姓名 | 职称 | 基本 I 资 | 津贴 | 扣除 
100] 50 
1002 20 


1o03 300 Io0 
lo04 | 强 | 裤 | 60 | 3 | 2 
1005 工程 师 150 0 


1006 100 
1007 | 革履 | 助 Tr | ao | ss | a 
i008 | 内 | 助 T | ao | am | » 
1009 80 
1010 张 言 工程 师 0 200 80 
倒 排 表 的 工资 链 为 : 

600 1004 

800 : 1002、1007、1008 

1000 1001、1005、1009、1010 


1500 1003、1006 
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职称 链 为 : 
实习 1004 
助 工 1002、1007、1008 
工程 师 1001、1005、1009、1010 
高 工 1003、1006 


优点 : 可 在 倒 排 表 中 先 完成 查询 的 交 、 并 等 逻辑 运算 , 得 到 结果 后 再 对 记录 进行 存 取 ; 
存储 具有 相对 独立 性 。 
从 点 : 存 取 速 度 慢 ， 同 时 不 便于 插入 、 删 除 。 


10.3 ”文件 的 存储 


文件 的 存储 结构 是 指 文件 在 外 存 上 的 组 织 形式 。 基 本 组 织 形式 分 为 顺序 组 织 、 索 引 组 
织 、 散 列 组 织 和 链 组 织 。 

计算 机 的 存储 设备 有 主 存储 器 和 辅助 存储 器 之 分 ， 文 件 一 般 存 储 在 辅助 存储 器 中 ， 所 
以 对 文件 的 存储 主要 考虑 辅助 存储 器 。 辅 助 存储 器 的 存储 介质 一 般 有 磁带 、 磁 盘 和 光盘 等 。 
考虑 辅助 存储 器 的 主要 原因 是 辅助 存储 器 和 主 存储 器 相 比 主要 有 两 个 优点 : 

(1) 辅助 存储 器 存储 的 文件 是 永久 的 ， 也 就 是 当 电 源 断 电 后 ， 数 据 永 久 性 地 保存 在 辅 
助 存储 器 中 ， 而 主 存储 器 (RAM) 中 存储 的 内 容 会 因 断 电 而 丢失 ; 

(2) 辅助 存储 器 可 以 方便 地 把 磁盘 等 存储 介质 拿 到 其 他 计算 机 上 使 用 ， 为 计算 机 之 间 
的 信息 传递 提供 了 方便 ， 而 主 存储 器 则 不 能 。 

辅助 存储 器 尽管 有 以 上 两 个 主要 优点 并 且 价 格 便宜 ， 但 其 访问 时 间 和 RAM 相 比 比较 
长 ， 这 也 是 其 很 大 的 缺点 。 

如 何 提高 辅助 存储 器 的 访问 速度 是 文件 存储 时 首要 考虑 的 问题 。 存 储 介质 的 基本 存 取 
速度 一 般 是 固定 的 , 所 以 要 想 提高 速度 应 该 遵循 的 基本 原则 是 , 尽量 减少 磁盘 的 访问 次 数 。 

减少 磁盘 的 访问 次 数 的 方法 一 般 有 两 种 : 

(1) 将 信息 安排 在 适当 位 置 ， 目 的 是 以 尽 可 能 少 的 访问 次 数 得 到 需要 的 数据 。 文 件 结 
构 的 组 织 应 使 磁盘 的 访问 次 数 最 少 。 

(2) 压缩 存储 在 磁盘 中 的 信息 ， 目 的 是 在 时 间 相同 的 情况 下 ， 获 得 更 多 的 信息 。 这 种 
方法 在 解压 时 需要 占用 CPU 的 时 间 , 相对 而 言 , 比 从 磁盘 中 读 取 信息 省 下 来 的 时 间 少 得 多 。 


10.3.1 磁盘 


磁盘 通常 称 为 直接 访问 存储 设备 。 磁 盘 是 随机 存 取 设备 ， 磁 盘 中 通常 以 存储 非 顺 序 文 
件 为 主 ， 磁 盘 的 读 取 单位 不 是 以 位 为 单位 ， 而 是 以 肩 区 为 单位 。 使 用 磁盘 时 主要 有 3 个 时 
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间 需 要 考虑 : 

(1) 寻找 时 间 ”磁头 从 当前 位 置 移 到 数据 存放 磁道 位 置 后 所 花 的 时 间 ， 或 者 叫做 寻 道 
时 间 。 

(2) 延 运 时 间 ”磁头 从 当前 证 区 移动 到 数据 存放 扇 区 位 置 时 所 花 的 时 间 ， 或 者 叫做 旋 
转 时 间 。 

(3) 传送 时 间 . 数据 从 磁盘 读 取 数据 ， 并 将 数据 传送 到 内 存 的 时 间 。 

其 中 寻找 时 间 和 延迟 时 间 可 以 通过 操作 系统 的 磁盘 调度 实现 ， 以 尽量 减少 数据 的 存 取 
时 间 ， 而 传送 时 间 因 为 每 个 磁盘 的 旋转 速率 是 固定 的 ， 所 以 对 某 个 磁盘 而 言 ， 其 传输 时 间 
通 弟 不 变 。 

磁盘 盘 片 组 织 如 图 10-3 所 示 。 





图 10-3 ”磁盘 盘 片 组 织 


磁道 是 盘 片 上 的 同心 圆 。 柱 面 是 同一 盘 组 上 半径 相同 的 磁道 合 在 一 起 。 扇 区 是 将 磁盘 
中 的 磁道 划分 成 大 小 相同 的 扇面 。 

磁盘 中 存储 的 数据 有 固定 的 物理 地 址 ， 磁 盘 的 物理 地 址 由 3 部 分 决定 : 柱 面 、 磁 道 和 
扇 区 。 

在 现在 的 磁盘 管理 中 , 一 般 使 用 逻辑 的 组 织 管理 单位 一 一 簇 , 簇 一 般 由 几 个 扁 区 组 成 ， 
计算 机 在 数据 读 取 时 ， 以 簇 为 单位 不 再 以 扁 区 为 单位 ， 簇 不 能 太 大 也 不 能 太 小 。 因 为 簇 具 
有 一 个 比较 明显 的 特点 : 独占 性 。 所 谓 独 占 性 是 指 一 个 艇 中 只 要 存储 了 同一 个 文件 的 一 个 
字 节 ， 就 不 能 再 存储 其 他 文件 的 内 容 。 所 以 簇 太 大 会 造成 存储 空间 的 大 量 浪费 ， 而 太 小 则 
使 计算 机 管理 的 磁盘 空间 减少 。 


10.3.2 ”磁带 





人 磁 市 通 第 称 为 顺序 存储 设备 。 磁 带 是 顺序 存 取 设 备 ， 使 用 磁带 时 和 磁盘 不 同 ， 它 只 能 
顺序 访问 。 磁 带 如 果 不 正 转 或 者 反 转 ， 就 不 能 从 当前 位 置 到 达 目标 位 置 。 其 组 织 如 图 10-4 
所 示 。 / 
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间 则 间 
块 块 


图 10-4 ”磁带 组 织 图 





磁带 的 存 取 单位 是 磁带 长 度 ， 每 一 个 存储 单位 是 块 ， 影 响 磁带 的 一 个 物理 特性 是 磁带 
驱动 器 需要 花费 时 间 使 磁带 停 下 来 ， 这 就 需要 磁带 的 块 间 间隔 。1/O 磁头 需要 识别 间隔 ， 
同时 间隔 也 浪费 大 量 空间 。 间 隔 太 大 浪费 空间 ， 间 隔 太 小 WO 磁头 的 识别 时 间 不 够 。 一 般 
将 多 条 记录 组 织 到 一 个 块 中 ， 一 个 块 中 的 记录 的 个 数 称 为 块 因子 。 

磁带 的 另 一 个 性 能 度量 是 数据 的 传送 速度 ， 块 间 间隔 减少 了 数据 的 存储 密度 ， 提 高 了 
传输 的 速率 。 

磁带 只 适用 于 顺序 访问 , 一 般 不 能 存储 存 取 速度 要 求 比较 高 的 数据 , 它 价格 比较 便宜 ， 
通常 用 来 备份 数据 或 归档 。 

对 于 磁带 来 说 ， 它 所 需要 的 存 取 设备 是 磁带 机 ， 数 据 存储 时 通常 可 用 多 台 磁 带 机 并 行 
工作 ， 以 提高 效率 。 

对 于 外 存 来 说 : 磁带 只 适宜 存储 顺序 文件 ， 磁 盘 则 适宜 存储 顺序 、 索 引 、 散 列 和 多 关 
键 字 等 随机 存 取 文件 。 

除了 磁盘 、 磁 带 等 外 存 设 备 以 外 ， 还 有 CD-ROM、 闪 存 等 设备 。 


思考 和 练习 


( 假设 一 个 磁盘 分 成 10 个 盘面 ， 每 个 盘面 有 128 个 磁道 ， 每 个 磁道 有 64 个 扇 区 ， 
每 个 肩 区 有 512 个 字 和 ， 问 位 盘 的 容量 是 多 少 ? 

(2) 有 一 个 6250bpi 的 磁带 驱动 器 , 记录 大 小 是 160 个 字 节 , 一 个 块 间 间隔 是 0.3 类 寸 ， 
如 果 让 90% 的 磁带 都 包含 数据 ， 需 要 的 块 因子 是 多 少 ? 

(3) 对 9 个 归并 段 和 8 个 归并 有 段 的 两 个 文件 , 试用 4 台 磁 带 机 做 二 路 归并 和 多 路 归并 ， 
并 对 两 种 归并 方法 进行 比较 。 

(4) 假设 某 个 文件 经 过 内 部 排序 得 到 100 个 初始 归并 段 ， 问 : 若 要 使 多 路 归并 3 趟 完 
成 排序 ， 则 应 取 的 归并 路 数 应 是 多 少 ? 

(5) 假设 490 个 初始 归并 7 段 ， 将 做 5 路 磁 斋 多 路 归并 ， 问 : 需要 多 少 步 归并 才能 得 到 
一 个 有 序 文 件 ? 初始 归并 段 应 在 5 全 磁带 机 上 如 何 分 布 ? 
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